MetaTrader 5 - Trading Machine Learning: Wie Support Vector Maschinen können im Trading verwendet werden Was ist ein Support Vector Machine Eine Support-Vektor-Maschine ist eine Methode des maschinellen Lernens, die versucht, die Eingabedaten zu nehmen und zu klassifizieren in eine von zwei Kategorien. Damit eine Unterstützungsvektormaschine wirksam ist, ist es notwendig, zuerst einen Satz von Trainingseingabe - und Ausgabedaten zu verwenden, um das Unterstützungsvektor-Maschinenmodell zu erstellen, das zum Klassifizieren neuer Daten verwendet werden kann. Eine Unterstützungsvektormaschine entwickelt dieses Modell, indem sie die Trainingseingaben aufnimmt, sie in mehrdimensionalen Raum abbildet und dann mit Hilfe einer Regression eine Hyperplane (eine Hyperplane ist eine Oberfläche im n-dimensionalen Raum, die den Raum in zwei Halbräume trennt) am besten trennt Die beiden Klassen von Eingaben. Sobald die Träger-Vektor-Maschine trainiert worden ist, ist sie in der Lage, neue Eingaben in Bezug auf die Trenn-Hyperebene zu beurteilen und sie in eine der beiden Kategorien zu klassifizieren. Eine Träger-Vektor-Maschine ist im wesentlichen eine Eingabe-Ausgabe-Maschine. Ein Benutzer ist in der Lage, einen Eingang zu setzen, und basierend auf dem Modell, das durch Training entwickelt wird, gibt es eine Ausgabe zurück. Die Anzahl der Eingaben für eine gegebene Unterstützungsvektormaschine reicht theoretisch von einem bis unendlich, aber in der Praxis rechnet die Rechenleistung, wie viele Eingänge verwendet werden können. Wenn zum Beispiel N-Eingänge für eine spezielle Unterstützungsvektormaschine verwendet werden (wobei der ganzzahlige Wert von N von 1 bis unendlich reichen kann), muss die Unterstützungsvektormaschine jeden Satz von Eingaben in den N-dimensionalen Raum abbilden und eine (N-1 ) - dimensionale Hyperplane, die die Trainingsdaten am besten trennt. Abbildung 1. Support-Vektor-Maschinen sind Input-Output-Maschinen Der beste Weg, um zu verstehen, wie eine Support-Vektor-Maschine funktioniert, ist durch die Berücksichtigung der zweidimensionalen Fall. Angenommen, wir wollen eine Unterstützungsvektormaschine erstellen, die zwei Eingaben hat und einen einzelnen Ausgang zurückgibt, der den Datenpunkt als zu einer von zwei Kategorien gehörig klassifiziert. Wir können dies visualisieren, indem wir es auf einem 2-dimensionalen Diagramm wie dem Diagramm unten plotten. Abbildung 2. Links: Unterstützung von Vektor-Maschineneingängen, die einem 2D-Diagramm zugeordnet sind. Die roten Kreise und blauen Kreuze werden verwendet, um die beiden Klassen von Eingaben zu bezeichnen. Figure 3. Right: Unterstützung von Vektor-Maschineneingaben, die einem 2D-Diagramm zugeordnet sind. Die roten Kreise und blauen Kreuze werden verwendet, um die beiden Klassen von Eingängen mit einer schwarzen Linie zu bezeichnen, die die trennende Hyperebene anzeigt. In diesem Beispiel geben die blauen Kreuze Datenpunkte an, die zur Kategorie 1 gehören, und die roten Kreise, die Datenpunkte darstellen, die zur Kategorie 2 gehören. Jeder der einzelnen Datenpunkte hat einen eindeutigen Eingang 1-Wert (dargestellt durch ihre Position auf der x-Achse ) Und einen eindeutigen Eingang 2-Wert (repräsentiert durch ihre Position auf der y-Achse), und alle diese Punkte wurden dem 2-dimensionalen Raum zugeordnet. Eine Unterstützungsvektormaschine ist in der Lage, Daten zu klassifizieren, indem sie ein Modell dieser Punkte im zweidimensionalen Raum erzeugt. Die Unterstützungsvektormaschine beobachtet die Daten im zweidimensionalen Raum und verwendet einen Regressionsalgorithmus, um eine 1-dimensionale Hyperplane (aka Linie) zu finden, die die Daten in die zwei Kategorien am genauesten trennt. Diese Trennlinie wird dann von der Unterstützungsvektormaschine verwendet, um neue Datenpunkte in entweder Kategorie 1 oder Kategorie 2 zu klassifizieren. Die nachfolgende Animation veranschaulicht den Prozess des Trainierens einer neuen Unterstützungsvektormaschine. Der Algorithmus beginnt mit einer zufälligen Vermutung, die eine Trennungshyperplane findet, dann iterativ die Genauigkeit der Hyperebene zu verbessern. Wie Sie sehen können, der Algorithmus beginnt ziemlich aggressiv, aber dann verlangsamt, wie es beginnt, um die Wünsche Lösung Ansatz. Fig. 4. Eine Animation, die eine Trainingsunterstützungsvektor-Maschine zeigt. Die Hyperplane konvergiert schrittweise über die ideale Geometrie, um die beiden Datenklassen zu trennen Das oben dargestellte 2-dimensionale Szenario erlaubt es uns, den Prozess einer Unterstützungsvektormaschine zu visualisieren, er kann jedoch nur einen Datenpunkt mit zwei Eingängen klassifizieren. Was, wenn wir mehr Eingaben verwenden möchten Dankbar, der Support-Vektor-Maschinen-Algorithmus ermöglicht es uns, das gleiche in höheren Dimensionen zu tun, obwohl es viel schwerer zu konzipieren. Betrachten Sie dies, möchten Sie Support-Vektor-Maschine, die 20 Eingaben nimmt zu erstellen und können alle Datenpunkt mit diesen Eingaben in Kategorie 1 oder Kategorie zu klassifizieren. Um dies zu tun, muss die Support-Vektor-Maschine die Daten in 20 dimensionalen Raum zu modellieren Und verwenden Sie einen Regressionsalgorithmus, um eine 19-dimensionale Hyperebene zu finden, die die Datenpunkte in zwei Kategorien trennt. Dies wird außerordentlich schwierig zu visualisieren, da es schwer für uns ist, etwas über 3-Dimensionen zu verstehen, aber alles, was Sie wissen müssen, ist, dass funktioniert genau so wie es für den 2-dimensionalen Fall funktioniert. Wie unterstützen Vector Machines Beispiel: Ist es ein Schnick Stellen Sie sich dieses hypothetische Szenario, Sie sind ein Forscher untersucht ein seltenes Tier nur in den Tiefen der Arktis namens Shnicks gefunden. Angesichts der Abgelegenheit dieser Tiere, nur eine kleine Handvoll jemals gefunden worden sind (sagen wir etwa 5000). Als Forscher sind Sie mit der Frage stecken. Wie kann ich einen Schnick identifizieren Alles, was Sie zu Ihrer Verfügung haben, sind die Forschung Papiere zuvor von der Handvoll von Forschern, die ein gesehen haben, veröffentlicht. In diesen Forschungsarbeiten beschreiben die Autoren bestimmte Merkmale über die gefundenen Schnicks, d. h. die Höhe, das Gewicht, die Anzahl der Beine usw. Aber alle diese Merkmale variieren zwischen den Forschungspapieren ohne erkennbares Muster. Wie können wir diese Daten verwenden, um ein neues Tier als Schnick zu identifizieren? Eine mögliche Lösung für unser Problem ist die Verwendung einer Stützvektormaschine, um die Muster in den Daten zu identifizieren und ein Rahmenwerk zu schaffen, das verwendet werden kann, um Tiere entweder als einen Schnick oder zu klassifizieren Nicht ein Schnick. Der erste Schritt ist die Erstellung einer Reihe von Daten, die verwendet werden können, um Ihre Unterstützung Vektor-Maschine, um Schnicks zu identifizieren. Die Trainingsdaten sind ein Satz von Eingängen und passenden Ausgängen für die Unterstützungsvektormaschine, um ein Muster zu analysieren und zu extrahieren. Daher müssen wir entscheiden, welche Eingaben verwendet werden und wie viele. Theoretisch können wir so viele Eingaben haben, wie wir wollen, aber dies kann oft zu langsamen Training führen (je mehr Eingaben Sie haben, desto mehr Zeit braucht die Unterstützung Vektor-Maschine, um Muster zu extrahieren). Außerdem möchten Sie Eingaben Werte, die dazu neigen, relativ konsistent über alle Schnicks werden. Zum Beispiel, Höhe oder Gewicht des Tieres wäre ein gutes Beispiel für eine Eingabe, weil Sie erwarten würden, dass dies relativ konsistent über alle Schnicks wäre. Das durchschnittliche Alter eines Tieres wäre jedoch eine schlechte Wahl, da Sie erwarten würden, dass das Alter der identifizierten Tiere sehr unterschiedlich ausfallen würde. Aus diesem Grund wurden die folgenden Eingaben gewählt: Höhe Gewicht Die Anzahl der Beine Die Anzahl der Augen Die Länge der Tiere Arme Die Tiere durchschnittliche Geschwindigkeit Die Häufigkeit der Tiere passender Anruf Mit den gewählten Eingaben können wir beginnen, unsere Trainingsdaten zu kompilieren . Effektive Trainingsdaten für eine Support-Vektor-Maschine müssen bestimmte Anforderungen erfüllen: Die Daten müssen Beispiele für Tiere, die Schnicks sind Die Daten müssen Beispiele für Tiere, die nicht Schnicks sind In diesem Fall haben wir die Forschungsarbeiten von Wissenschaftler, die erfolgreich einen Schnick identifiziert haben Und ihre Eigenschaften aufgelistet. Daher können wir diese Forschungsberichte lesen und die Daten unter jedem der Eingaben extrahieren und jedem der Beispiele eine Ausgabe von entweder wahr oder falsch zuordnen. Die Trainingsdaten können in diesem Fall ähnlich der folgenden Tabelle aussehen. Tabelle 1. Beispieltabelle von schnick-Beobachtungen Nachdem wir die Daten für alle unsere Trainings-Inputs und Outputs gesammelt haben, können wir sie verwenden, um unsere Support-Vektor-Maschine zu trainieren. Während des Trainingsprozesses wird die Unterstützungsvektormaschine ein Modell im siebendimensionalen Raum schaffen, das verwendet werden kann, um jedes der Trainingsbeispiele in entweder wahr oder falsch zu sortieren. Die Unterstützungsvektormaschine wird dies weiterhin tun, bis sie ein Modell aufweist, das die Trainingsdaten genau darstellt (innerhalb der spezifizierten Fehlertoleranz). Sobald das Training abgeschlossen ist, kann dieses Modell verwendet werden, um neue Datenpunkte als wahr oder falsch zu klassifizieren. Ist die Support-Vector-Maschine tatsächlich mit dem Schnick-Szenario arbeiten, habe ich ein Skript, das testet, wie gut eine Support-Vektor-Maschine kann tatsächlich identifizieren neue Schnicks. Um dies zu tun, habe ich die Unterstützung Vector Machine Learning Tool-Funktion Bibliothek, die vom Markt heruntergeladen werden können verwendet. Um dieses Szenario effektiv zu modellieren, müssen wir zunächst entscheiden, was die tatsächlichen Eigenschaften eines Schnick sind. Die Eigenschaften, die ich in diesem Fall angenommen habe, sind in der folgenden Tabelle aufgelistet. Wenn ein Tier alle Kriterien erfüllt, dann ist es ein Schnick. Tabelle 2. Zusammenfassung der Parameter, die einen schnick definieren Nachdem wir unseren Schnick definiert haben, können wir diese Definition verwenden, um mit Support-Vektor-Maschinen zu experimentieren. Der erste Schritt ist, eine Funktion zu schaffen, die in der Lage ist, die sieben Eingaben für jedes gegebene Tier zu nehmen und die tatsächliche Klassifizierung des Tieres als einen Schnick zurückzugeben oder nicht. Diese Funktion wird verwendet, um Trainingsdaten für die Unterstützungsvektormaschine zu generieren und die Leistung davon am Ende zu beurteilen. Dies kann mit Hilfe der folgenden Funktion geschehen Der nächste Schritt besteht darin, eine Funktion zu erstellen, die die Trainingseingaben und - ausgänge generieren kann. Eingaben in diesem Fall werden erzeugt, indem Zufallszahlen innerhalb eines festgelegten Bereichs für jeden der sieben Eingangswerte erzeugt werden. Dann wird für jede der erzeugten Sätze von Zufallseingängen die obItASchnick () - Funktion verwendet, um die entsprechende gewünschte Ausgabe zu erzeugen. Dies geschieht in der folgenden Funktion: Wir haben jetzt eine Reihe von Trainings-Inputs und Outputs, es ist nun Zeit, unsere Support-Vektor-Maschinen mit dem Support Vector Machine Learning Tool auf dem Markt verfügbar zu erstellen. Sobald eine neue Support-Vektor-Maschine erstellt wird, ist es notwendig, die Trainingseingaben und - ausgänge an sie weiterzugeben und das Training auszuführen. Wir haben jetzt eine Support-Vektor-Maschine, die erfolgreich bei der Identifizierung von Scnhicks trainiert wurde. Um dies zu überprüfen, können wir die letzte Unterstützungsvektormaschine testen, indem wir sie bitten, neue Datenpunkte zu klassifizieren. Dies geschieht, indem zuerst zufällige Eingaben generiert werden und dann mit der isItASchnick () - Funktion ermittelt wird, ob diese Eingaben einem tatsächlichen Schnick entsprechen, und dann mit Hilfe der Support-Vektor-Maschine die Eingaben zu klassifizieren und zu bestimmen, ob das vorhergesagte Ergebnis dem tatsächlichen Ergebnis entspricht. Dies geschieht in der folgenden Funktion: Ich empfehle, mit den Werten innerhalb der obigen Funktionen zu spielen, um zu sehen, wie die Support-Vektor-Maschine unter verschiedenen Bedingungen arbeitet. Warum ist Support Vector Machine so nützlich Der Nutzen einer Unterstützung Vektor-Maschine, um komplexe Muster aus den Daten zu extrahieren ist, dass es nicht notwendig ist, ein vorheriges Verständnis des Verhaltens der Daten. Eine Support-Vektor-Maschine ist in der Lage, die Daten zu analysieren und extrahieren ihre einzigen Einsichten und Beziehungen. Auf diese Weise funktioniert es ähnlich wie eine Blackbox, die Eingänge empfängt und eine Ausgabe erzeugt, die sich als sehr nützlich erweisen kann, um Muster in den Daten zu finden, die zu komplex und nicht offensichtlich sind. Eine der besten Eigenschaften von Unterstützungsvektormaschinen ist, dass sie in der Lage sind, mit Fehlern und Rauschen in den Daten sehr gut umzugehen. Sie sind oft in der Lage, die zugrunde liegenden Muster innerhalb der Daten zu sehen und herauszufiltern Daten Ausreißer und andere Komplexitäten. Betrachten Sie das folgende Szenario, bei der Durchführung Ihrer Forschung auf Schnicks, kommen Sie auf mehrere Forschungs-Papiere, die beschreiben Schnicks mit massiv verschiedenen Eigenschaften (wie ein Schnick, dass 200kg und ist 15000mm groß). Solche Fehler können zu Verzerrungen Ihres Modells führen, was ein Schnick ist, was bei der Klassifizierung neuer Schnick-Entdeckungen möglicherweise einen Fehler verursachen könnte. Der Vorteil der Unterstützungsvektormaschine ist, dass sie ein Modell entwickelt, das mit dem zugrundeliegenden Muster, das einem Modell entgegengesetzt ist, das zu allen Trainingsdatenpunkten passt, übereinstimmt. Dies geschieht, indem ein bestimmter Fehlergrad in dem Modell ermöglicht wird, um der Unterstützungsvektormaschine zu erlauben, irgendwelche Fehler in den Daten zu übersehen. Im Falle der Schnick-Support-Vektor-Maschine, wenn wir eine Fehlertoleranz von 5 erlauben, wird das Training nur versuchen, ein Modell zu entwickeln, das mit 95 der Trainingsdaten übereinstimmt. Dies kann nützlich sein, weil es erlaubt, den kleinen Prozentsatz der Ausreißer zu ignorieren. Wir können diese Eigenschaft der Support-Vektor-Maschine weiter zu untersuchen, indem wir unsere Schnick-Skript. Die Funktion unten wurde hinzugefügt, um bewusste Zufallsfehler in unserem Trainingsdatensatz einzuführen. Diese Funktion wählt Trainingspunkte zufällig aus und ersetzt die Eingänge und die entsprechende Ausgabe durch Zufallsvariablen. Mit dieser Funktion können wir bewusste Fehler in unsere Trainingsdaten einführen. Mit diesem Fehler gefüllt Daten, können wir erstellen und trainieren Sie eine neue Unterstützung Vektor-Maschine und vergleichen Sie die Leistung mit der ursprünglichen. Wenn das Skript ausgeführt wird, erzeugt es die folgenden Ergebnisse im Expertenprotokoll. Innerhalb eines Trainingsdatensatzes mit 5000 Trainingspunkten konnten wir 500 zufällige Fehler einführen. Beim Vergleich der Leistung dieser Fehler gefüllten Support-Vektor-Maschine mit der ursprünglichen, wird die Leistung nur von lt1 reduziert. Dies liegt daran, dass die Unterstützungsvektormaschine in der Lage ist, die Ausreißer in dem Datensatz beim Training zu übersehen und noch in der Lage ist, ein eindrucksvoll genaues Modell der wahren Daten zu erzeugen. Dies deutet darauf hin, dass Support-Vektor-Maschinen möglicherweise ein nützlicheres Werkzeug bei der Extraktion von komplexen Mustern und Erkenntnisse aus lärmenden Datensätzen. Abbildung 5. Das resultierende Expertenprotokoll nach dem Ausführen des Schnick-Skripts im MetaTrader 5. Demoversionen Eine Vollversion des obigen Codes kann von Code Base heruntergeladen werden. Dieses Skript kann jedoch nur in Ihrem Terminal ausgeführt werden, wenn Sie ein Vollversion des Support Vector Machine Learning-Tools aus dem Markt. Wenn Sie nur eine Demo-Version dieses Tools heruntergeladen haben, werden Sie auf die Verwendung des Tools über die Strategie-Tester beschränkt werden. Um das Testen des Schnick-Codes mithilfe der Demo-Version des Tools zu ermöglichen, habe ich eine Kopie des Skripts in einen Expert Advisor umgeschrieben, der mit dem Strategie-Tester bereitgestellt werden kann. Beide Code-Versionen können heruntergeladen werden, indem die folgenden Links heruntergeladen werden: Vollversion - Verwenden eines Skripts, das im MetaTrader 5-Terminal bereitgestellt wird (erfordert eine gekaufte Version des Support Vector Machine Learning-Tools) Demo Version - mit einem Expertenratgeber Eingesetzt im MetaTrader 5-Strategie-Tester (benötigt nur eine Demo-Version des Support Vector Machine Learning Tool) Wie kann der Einsatz von Vector-Maschinen im Markt verwendet werden Zugegeben, das Schnick-Beispiel oben diskutiert ist ganz einfach, aber es gibt ein paar Gemeinsamkeiten Kann zwischen diesem Beispiel und unter Verwendung der Support-Vektor-Maschinen für die technische Marktanalyse gezogen werden. Bei der technischen Analyse geht es im Wesentlichen darum, historische Marktdaten zu verwenden, um zukünftige Preisbewegungen vorherzusagen. In ähnlicher Weise haben wir im Rahmen des Schnick-Beispiels die Beobachtungen früherer Wissenschaftler verwendet, um vorherzusagen, ob ein neues Tier ein Schnick ist oder nicht. Darüber hinaus ist der Markt mit Rauschen, Fehler und statistische Ausreißer geplagt, dass die Verwendung einer Support-Vektor-Maschine ein interessantes Konzept zu machen. Die Grundlage für eine beträchtliche Anzahl von Analysen-Trading-Ansätzen sind die folgenden Schritte: Überwachung mehrerer Indikatoren Identifizieren, welche Bedingungen für jeden Indikator korreliert mit einem potenziell erfolgreichen Handel Beobachten Sie jeden Indikator und bewerten Sie, wenn alle (oder die meisten) Ist es möglich, einen ähnlichen Ansatz zu verwenden, um Vektor-Maschinen zu unterstützen, um neue Trades in ähnlicher Weise zu signalisieren. Das Lerninstrument der Unterstützungsvektormaschine wurde in diesem Sinne entwickelt. Eine vollständige Beschreibung, wie dieses Tool zu nutzen ist, kann im Markt gefunden werden, so dass ich nur einen schnellen Überblick geben. Der Prozess für die Verwendung dieses Tools ist wie folgt: Abbildung 6. Das Blockdiagramm, das den Prozess für die Implementierung der Support-Vektor-Werkzeugmaschine in einem Expert Advisor zeigt Bevor Sie das Support Vector Machine Learning Tool verwenden können, ist es wichtig, zuerst zu verstehen, wie das Training Werden Ein - und Ausgänge erzeugt. Wie werden Trainings-Inputs generiert So wurden die Indikatoren, die Sie als Input verwenden möchten, bereits initialisiert sowie Ihre neue Support-Vektor-Maschine. Der nächste Schritt besteht darin, die Indikatorgriffe an Ihre neue Support-Vektor-Maschine weiterzugeben und anzugeben, wie die Trainingsdaten generiert werden. Dies geschieht durch Aufruf der Funktion setIndicatorHandles (). Mit dieser Funktion können Sie die Griffe der initialisierten Indikatoren in die Support-Vektor-Maschine übergeben. Dies geschieht durch Übergeben und Integer-Array mit den Handles. Die beiden anderen Eingänge für diese Funktion sind der Versatzwert und die Anzahl der Datenpunkte. Der Versatzwert bezeichnet den Versatz zwischen dem aktuellen Balken und dem Startstab, der beim Erzeugen der Trainingseingaben verwendet werden soll, und die Anzahl der Trainingspunkte (mit N bezeichnet) setzt die Größe Ihrer Trainingsdaten. Das folgende Diagramm zeigt die Verwendung dieser Werte. Ein Offset-Wert von 4 und ein N-Wert von 6 werden der Support-Vektor-Maschine sagen, dass sie nur die in dem weißen Quadrat erfassten Balken verwenden, um Trainingseingaben und - ausgänge zu erzeugen. In ähnlicher Weise werden ein Versatzwert von 8 und ein N-Wert von 8 der Unterstützungsvektormaschine mitteilen, um nur die in dem blauen Quadrat erfassten Balken zu verwenden, um Trainingseingaben und Ausgänge zu erzeugen. Nach Aufruf der Funktion setIndicatorHandles () ist es möglich, die Funktion genInputs () aufzurufen. Diese Funktion verwendet die Indikatorgriffe, um zu übergeben, um ein Array von Eingabedaten zu erzeugen, die für das Training verwendet werden sollen. Abbildung 7. Candle Chart zur Darstellung der Werte von Offset und N Wie werden Trainingsausgaben generiert Trainingsausgaben werden durch Simulationen von hypothetischen Trades basierend auf historischen Preisdaten und Bestimmung, ob ein solcher Trade erfolgreich oder erfolglos gewesen wäre, erzeugt. Um dies zu tun, gibt es ein paar Parameter, die verwendet werden, um die Unterstützung Vektor Maschine lernen Werkzeug, wie man einen hypothetischen Handel als erfolgreich oder erfolglos zu beurteilen. Die erste Variable ist OPTRADE. Der Wert kann entweder KAUF oder VERKAUF sein und entspricht entweder hypothetischen Kauf - oder Verkaufsgeschäften. Wenn der Wert von BUY ist, dann wird beim Erzeugen der Outputs nur der mögliche Erfolg von hypothetischen Buy Trades betrachtet. Alternativ, wenn der Wert von diesem ist SELL, dann bei der Erzeugung der Ausgänge wird es nur auf den potenziellen Erfolg der hypothetischen verkaufen Handeln. Die nächsten Werte sind die Stop Loss und Take Profit für diese hypothetischen Trades. Die Werte werden in Pips gesetzt und legen die Stopp - und Grenzwerte für jeden der hypothetischen Trades fest. Der letzte Parameter ist die Handelsdauer. Diese Variable wird in Stunden gemessen und stellt sicher, dass nur Trades, die innerhalb dieser maximalen Dauer abgeschlossen sind, als erfolgreich angesehen werden. Der Grund für die Einbeziehung dieser Variable besteht darin, die Unterstützungsvektormaschinensignalisierung in einem sich langsam bewegenden Seitwärtsmarkt zu vermeiden. Überlegungen bei der Auswahl von Eingaben Es ist wichtig, einige Gedanken in die Eingabe-Auswahl setzen, wenn Implementierung Support-Vektor-Maschinen in Ihrem Trading. Ähnlich dem Schnick-Beispiel ist es wichtig, einen Eingang zu wählen, von dem erwartet wird, dass er ähnliche Unterschiede aufweist. Zum Beispiel können Sie versucht werden, einen gleitenden Durchschnitt als Eingang zu verwenden, aber da der langfristige Durchschnittspreis dazu tendiert, sich ziemlich dramatisch über der Zeit zu ändern, kann ein gleitender Durchschnitt in der Isolation nicht der beste Eingang sein, um zu verwenden. Dies liegt daran, dass es keine signifikante Ähnlichkeit zwischen dem gleitenden Durchschnittswert heute und den gleitenden Durchschnittswerten vor sechs Monaten. Angenommen, wir handeln EURUSD und verwenden eine Unterstützungsvektormaschine mit einem gleitenden durchschnittlichen Eingang zum Signalkaufhandel. Sagen der aktuelle Preis ist 1,10, aber es ist die Erzeugung von Trainingsdaten von sechs Monaten, als der Preis 0,55 war. Beim Trainieren der Support-Vektor-Maschine kann das Muster, das es findet, nur zu einem Handel führen, der signalisiert wird, wenn der Preis etwa 0,55 ist, da dies die einzigen Daten ist, die er kennt. Daher kann Ihre Unterstützung Vektor-Maschine nie signalisieren, einen Handel, bis der Preis sinkt wieder auf 0,55. Stattdessen kann ein besserer Eingang für die Unterstützungsvektormaschine ein MACD oder ein ähnlicher Oszillator sein, weil der Wert des MACD von dem durchschnittlichen Preisniveau unabhängig ist und nur eine relative Bewegung signalisiert. Ich empfehle Ihnen, mit diesem zu experimentieren, um zu sehen, was die besten Ergebnisse für Sie produziert. Eine weitere Überlegung, die bei der Auswahl von Eingaben zu treffen ist, stellt sicher, dass die Unterstützungsvektormaschine eine angemessene Momentaufnahme eines Indikators aufweist, um einen neuen Handel zu signalisieren. Sie können in Ihrer eigenen Handelserfahrung finden, dass ein MACD nur nützlich ist, wenn Sie die letzten fünf Bars zu betrachten haben, da dies einen Trend zeigen wird. Ein einziger Stab des MACD kann nutzlos in Isolation sein, es sei denn, Sie können sagen, ob es oben oder unten Position ist. Daher kann es notwendig sein, die letzten Takte der MACD-Anzeige an die Support-Vektor-Maschine zu übergeben. Es gibt zwei Möglichkeiten, wie Sie dies tun können: Sie können ein neues benutzerdefiniertes Kennzeichen erstellen, das die letzten fünf Balken der MACD-Anzeige verwendet Einen Trend als Einzelwert berechnen. Dieses benutzerdefinierte Kennzeichen kann dann als eine einzige Eingabe an die Unterstützungsvektormaschine übergeben werden, oder Sie können die vorherigen fünf Stäbe des MACD-Indikators in der Unterstützungsvektormaschine als fünf separate Eingaben verwenden. Dazu werden fünf verschiedene Instanzen des MACD-Indikators initialisiert. Jeder der Indikatoren kann mit einem anderen Offset des aktuellen Balkens initialisiert werden. Dann können die fünf Griffe von den separaten Indikatoren an die Unterstützungsvektormaschine übergeben werden. Es sollte beachtet werden, dass Option 2 dazu neigt, längere Ausführungszeiten für Ihren Expert Advisor zu verursachen. Je mehr Eingaben Sie haben, desto länger dauert es, um erfolgreich zu trainieren. Implementierung von Support-Vector-Maschinen in und Expert Advisor Ich habe einen Expert Advisor vorbereitet, der ein Beispiel dafür ist, wie jemand potentiell Support-Vektor-Maschinen im eigenen Handel verwenden könnte (eine Kopie davon kann von folgendem Link heruntergeladen werden: mql5encode1229). Hoffentlich der Expert Advisor ermöglicht es Ihnen, ein wenig mit Support-Vektor-Maschinen zu experimentieren. Ich empfehle Ihnen copychangemodify der Expert Advisor zu Ihrem eigenen Trading-Stil passen. Die EA arbeitet wie folgt: Zwei neue Support-Vektor-Maschinen werden mit Hilfe der Bibliothek svMachineTool erstellt. Einer wird eingerichtet, um neue Buy-Trades zu signalisieren, und der andere wird eingerichtet, um neue Sell-Trades zu signalisieren. Sieben Standardindikatoren werden mit jedem ihrer in einem Integer-Array gespeicherten Handles initialisiert (Anmerkung: Jede Kombination von Indikatoren kann als Eingaben verwendet werden, sie müssen nur an das SVM in einem einzigen Integer-Array übergeben werden). Das Array von Indikatorhandles wird an die neuen Unterstützungsvektormaschinen übergeben. Unter Verwendung des Arrays von Indikatorgriffen und anderen Parametern werden historische Preisdaten verwendet, um genaue Eingaben und Ausgänge zu erzeugen, die zum Trainieren der Unterstützungsvektormaschinen verwendet werden sollen. Sobald alle Eingänge und Ausgänge erzeugt worden sind, werden beide Träger-Vektor-Maschinen trainiert. Die ausgebildeten Support-Vektor-Maschinen werden in der EA verwendet, um neue Kauf - und Verkaufsgeschäfte zu signalisieren. Wenn ein neuer Kauf oder Verkauf Handel signalisiert wird, öffnet sich der Handel zusammen mit manuellen Stop Loss und Take Profit Bestellungen. Die Initialisierung und das Training der Support-Vektor-Maschine werden innerhalb der onInit () - Funktion ausgeführt. Für Ihre Referenz ist dieses Segment des svTrader EA im Folgenden im Anhang enthalten. Advanced Support Vector Machine Trading Zusätzliche Fähigkeit wurde in der Unterstützung Vektor Maschine Lernwerkzeug für die fortgeschrittenen Benutzer da draußen gebaut. Das Tool ermöglicht es Benutzern, ihre eigenen benutzerdefinierten Eingabedaten und Ausgabedaten (wie im Schnick-Beispiel) zu übergeben. Dies ermöglicht Ihnen, benutzerdefinierte Design Ihrer eigenen Kriterien für Support-Vektor-Maschine Eingänge und Ausgänge, und manuell übergeben in diese Daten zu trainieren. Dies eröffnet die Möglichkeit, Support-Vektor-Maschinen in jedem Aspekt Ihres Handels zu verwenden. Es ist nicht nur möglich, Support-Vektor-Maschinen verwenden, um neue Trades zu signalisieren, aber es kann auch verwendet werden, um die Schließung von Trades, Geld-Management, neue erweiterte Indikatoren usw. zu signalisieren. Um jedoch sicherzustellen, dass Sie keine Fehler erhalten, ist es wichtig zu verstehen, wie Diese Ein - und Ausgänge sollen strukturiert sein. Eingänge: Eingänge werden als 1-dimensionales Array von Doppelwerten an SVM übergeben. Bitte beachten Sie, dass jede Eingabe, die Sie erstellen, als doppelter Wert übergeben werden muss. Boolean, Integer, etc. müssen alle in einen Doppelwert konvertiert werden, bevor sie in die Support-Vektor-Maschine übergeben werden. Die Eingaben werden in der folgenden Form benötigt. Nehmen wir zum Beispiel an, dass wir Eingaben mit 3 Eingängen x 5 Trainingspunkten übergeben. Um dies zu erreichen, muss unsere doppelte Anordnung 15 Einheiten lang sein im Format: A 1 B 1 C 1 A 2 B 2 C 2 A 3 B 3 C 3 A 4 B 4 C 4 A 5 B 5 C 5 Es ist auch notwendig Einen Wert für die Anzahl der Eingänge übergeben. Im Fall NInputs3. Ausgänge: Ausgänge werden als Array von Booleschen Werten übergeben. Diese booleschen Werte sind der gewünschte Ausgang des SVM, der jedem der eingegebenen Eingänge entspricht. Nach dem obigen Beispiel, sagen wir, haben wir 5 Trainingspunkte. In diesem Szenario werden wir ein Boolesches Array von Ausgabewerten übergeben, das 5 Einheiten lang ist. Wenn Sie Ihre eigenen Eingaben und Ausgänge generieren, müssen Sie sicherstellen, dass die Länge der Arrays mit den Werten übereinstimmt, die Sie übergeben. Wenn sie nicht übereinstimmen, wird ein Fehler generiert, der Sie über die Diskrepanz informiert. Wenn wir beispielsweise in NInputs3 übergeben und inputs ein Array der Länge 16 ist, wird ein Fehler ausgelöst (da ein Ninputs-Wert von 3 bedeutet, dass die Länge eines beliebigen Eingangsarrays ein Vielfaches von 3 sein muss) . Ebenso stellen Sie sicher, dass die Anzahl der Sätze von Eingaben und die Anzahl der Ausgänge, die Sie übergeben, gleich sind. Wieder, wenn Sie NInputs3, Länge der Eingänge von 15 und eine Länge von Ausgängen von 6 haben, wird ein weiterer Fehler geworfen werden (wie Sie 5 Sätze von Eingängen und 6 Ausgänge haben). Versuchen Sie sicherzustellen, dass Sie genug Abwechslung in Ihren Trainingsausgaben haben. Wenn Sie beispielsweise 100 Ausbildungspunkte übergeben, also ein Ausgabemenü der Länge 100, und alle Werte mit nur einer Wahrheit falsch sind, dann reicht die Unterscheidung zwischen dem wahren und dem falschen Fall nicht aus. Dies wird dazu führen, dass die SVM Ausbildung sehr schnell, aber die endgültige Lösung ist sehr schlecht. Ein vielfältigeres Trainingsset wird oft zu einem affektiveren SVM führen. Training mit Support Vector Machines (SVM) Schließlich haben alle Sterne ausgerichtet und ich kann sicherlich etwas Zeit zum Backtesting neuer Trading-Systeme und Support Vector Machines (SVM ) Sind die neuen 8220toy8221, die mich beschäftigt für eine Weile halten wird. SVMs sind ein bekanntes Werkzeug aus dem Bereich der überwachten Machine Learning. Und sie werden sowohl für die Klassifizierung als auch für die Regression verwendet. Weitere Einzelheiten entnehmen Sie bitte der Literatur. Es scheint mir, dass die intuitive Anwendung für den Handel Regression ist, so let8217s durch den Aufbau eines SVM-Regressionsmodell zu starten. Nach unseren Erfahrungen mit ARMAGARCH-Modellen werden wir zunächst versuchen, die Rendite anstatt der Preise zu prognostizieren. Ebenso verwenden wir in unseren ersten Tests nur die Renditen der letzten 5 Tage als Merkmale, die die Rückkehr eines bestimmten Tages bestimmen. Wir beginnen mit der Geschichte von 500 Tagen als Trainingsset. In mathematischer Hinsicht haben wir für das Trainingsset N Merkmale, für jedes haben wir M Proben. Wir haben auch M Antworten. Bei einer Reihe von Merkmalswerten, der linken Matrix, wird das SVM trainiert, um den Antwortwert zu erzeugen. In unserem spezifischen Beispiel haben wir fünf Spalten (Merkmale), wobei jede Spalte den Rückgaben mit einer unterschiedlichen Verzögerung (von 1 bis 5) entspricht. Wir haben 500 Proben und die entsprechenden Antworten. Sobald das SVM auf diesem Set trainiert ist, können wir es mit Sätzen von fünf Funktionen, entsprechend den Renditen für die fünf vorherigen Tage, und die SVM wird uns mit der Antwort, die die prognostizierte Rendite wird. Nach dem Training des SVM auf den letzten 500 Tagen werden wir die Renditen für die Tage 500, 499, 498, 497 und 496 verwenden (diese sind die Eingabe, um die prognostizierte Rendite für Tag 501 zu erhalten.) Aus allen verfügbaren Paketen In R, entschied ich mich für die e1071-Paket zu wählen. Eine zweite Wahl war die kernlab-Paket, das ich noch planen, in der Zukunft zu versuchen. So habe ich versucht, ein paar Strategien. Ich habe versucht etwas sehr ähnlich dem ARMAGARCH Ansatz 8211 der Ich war ziemlich überrascht, diese Strategie besser als die ARMAGARCH (dies ist das Heimatland der ARMAGARCH und ich wäre sehr glücklich gewesen, nur mit vergleichbarer Leistung) zu sehen. Als nächstes versuchte ich, die gleichen fünf Funktionen, sondern versuchen, die beste Teilmenge zu wählen. Die Auswahl wurde mit einem gierigen Ansatz, beginnend mit 0-Funktionen, und interaktive Hinzufügen der Funktion, die den Fehler minimiert minimiert. Dieser Ansatz verbessert die Dinge weiter. Endlich habe ich versucht, einen anderen Ansatz mit etwa Ein Dutzend Funktionen. Die Funktionen enthalten Rückkehr über verschiedene Zeit (1 Tag, 2 Tage, 5 Tage, etc.), einige Statistiken (Mittelwert, Median, sd, etc.) und Volumen. Ich habe die gleiche gierige Ansatz, um Funktionen zu wählen. Dieses endgültige System zeigte auch eine sehr gute Leistung, aber es dauerte eine Hölle von einer Zeit zu laufen. Zeit, diesen Beitrag zu beenden, müssen die Back-Testergebnisse warten. Bis dahin können Sie mit dem vollständigen Quellcode selbst spielen. Hier ist ein Beispiel für die Verwendung: Hi In Windows doesn8217t Arbeit wegen Multicore-Problem. Eine weitere Sache, die ich don8217t verstehen, ist in diesen Zeilen der Code rets reflektiert retsindex (data) data dataindex (rets) Meiner Meinung nach ist es8217s effektiver, serie smth wie mydtret lt-aa. exclude (merge (rets, data) Und habe nur ein Argumentobjekt zu funktionieren Aufruf anstelle von 2 Interessante Arbeit, danke Mike Argh, Windows 8211 Ich benutze es selten in letzter Zeit. Er überrascht noch, da die parallele Paket ist Teil der Basis R Verteilung jetzt. Hoffentlich wird es bald adressiert werden In der Zwischenzeit, wie über nicht mit parallelen Ausführung Auch gibt es andere Pakete, die parallele Ausführung, aber das wäre mehr Arbeit. Sie haben Recht über die Merge 8211 Ich frage mich immer noch, warum ich es auf diese Weise dieses Mal getan :) I8217m Empfangen von Fehlern. Nun ist der Fehler gt data svmFeatures (tt), c (1,2) Fehler in match. fun (FUN). Objekt 8216skewness8217 nicht gefunden Aber wenn ich manuelles Datenobjekt mache, bekomme ich Fehler in der Vorhersage svmComputeOneForecast lt - Funktion im Zusammenhang mit Dimensionen und samplingquotcrossquot It039s schwierig für mich, Schiefereien zu debuggen kommt aus dem PerformanceAnalytics-Paket, das Sie von CRAN installieren müssen. Das Hinzufügen von Anforderungen (PerformanceAnalytics) als erste Zeile von svmFeatures sollte das erste Problem ansprechen. Jetzt ist ein Fehler in merge. xts (res, xts (naztrim (lag (rolmean, k 21, align 8220right8221) Länge von 8216dimnames8217 2 nicht gleich Array-Umfang scheint es, dass in Windows-Code braucht eine Menge von Änderungen Mike, ich habe nie gemeint, der Code direkt verwendet werden (bis jetzt war ich Bereitstellung nur Snippets), aber ich bin überrascht, dass R auf Windows so hässlich ist. Nicht sicher what8217s Ihr Ziel, sondern um die Strategien Leistung zu analysieren, können Sie die Indikator-Serie, die bereits berechnet. It8217s nur reine akademische Interesse an SVM. Ich arbeitete mit Clustern, PCA und ich bin gespannt, wie SVM tut die gleiche Arbeit. Fenster eine Menge Fehler sind auf Objekte mit Daten wie xts ist verwandt Oder Daten-Frames. Unix ist besser, aber alle Broker geben API für Fenster. Einige von ihnen in Java und nur das können wir von UNIX. I don8217t wie win Architektur aber it8217s eine Gewohnheit bereits und ich don8217t haben Zeit, OS zu ändern Ich habe eine Warnung von svmFeatures, die ich weiß, wie zu beheben (calling sd auf einem xtszoo-Objekt interessante Umwandlung in eine Matrix), aber keine Probleme. Läuft: Danke I8217ll versuchen. Eine Frage, wenn Sie don8217t Meinung Warum verwenden Sie mit der Funktion cetSymbols aus quantmod Paket Ich benutze CallVer Beispiel SPY lt-getSymbols (039SPY039, auto. assign FALSE) Sie haben viel zu berechnen und erhalten Sie verbrauchen Gedächtnis und braucht Zeit, um Objekte zu erhalten Name als String var Der gleiche Fehler I8217m mit R 2.15.1 Aber I8217m überrascht mit diesem Ergebnis vor Anruf gt head (data) 1 Funktion (8230, list character (), Paket NULL, lib. loc NULL, 2 verbose getOption (8220verbose8221 ), Envir. GlobalEnv) 3 4 fileExt lt - Funktion (x) 5 db lt - grepl (quot ... (gzbz2xz) quot, x) 6 ans lt - sub (quot, quotquot, x) Es scheint, dass Daten ist reserviert Wort Und jetzt weiß ich nicht, was los ist Features functionA Single SVM Trading-Strategie unterstützen Vector Machines (SVM) gewinnen an Popularität in der maschinellen Lernen Handelssysteme. Sie haben Vorteile Neuronale Netze (NN), wie sie garantiert die optimale Lösung finden. NN kann in einer lokalen Minima gefangen werden, so dass, während Sie ein Ergebnis mit NN erhalten Sie nie sicher sein, dass es optimal ist. Auch wenn NN mit zufälligen Gewichten gestartet werden, erhalten Sie wahrscheinlich einen anderen Satz von Gewichten, wenn Sie Backpropagation auf demselben Satz von Daten ausführen. SVMs haben ihre Nachteile zu. Speziell die Auswahl der Parameter 8216hyper8217. Dies sind die Strafen (C), gaußsche Breite (g), wenn ein RBF-Kernel und eine epsilon-Unempfindlichkeit (e) verwendet werden, wenn die Unterstützungsvektorregression (SVR) verwendet wird. Meine Verwendung von SVMs bisher war, um sie in der Klassifizierung verwenden, so dass ich nur die C-und g-Parameter 8211 wählen Ich benutze den Standard-RBF-Kernel. It8217s hart genug versuchen zu prognostizieren, ob der Markt nach oben oder unten gehen, geschweige denn, wie viel. Wir können diese Parameter über eine Rastersuche auswählen. Dies bedeutet, dass wir einfach versuchen, jede Kombination von Parametern und sehen, die am besten funktionierte. Die Bewertung der Parameter erfolgt über eine n-fache Kreuzvalidierung. Cross Validation Dies ist am besten mit einem Beispiel erklärt. Wenn wir 1000 beschriftete Trainings-Instanzen haben und wir 10-fache Kreuzvalidierung verwenden, dann machen wir für jede Kombination von C, g folgendes: Nehmen Sie zufällig 10 der Proben heraus. Das ist unser Holdout-Set aus 100 Trainingseinheiten. Trainieren Sie die SVM auf den verbleibenden 90 und erstellen Sie ein Modell. Verwenden Sie das Modell, um die Genauigkeit des Hold-out-Sets zu testen. Wiederholen Sie die Übung 10 mal und nehmen Sie die durchschnittliche Genauigkeit. Das oben genannte ist 10-fach Kreuz-Validierung. Wir könnten dies auf die logische Schlussfolgerung und haben nur eine einzige Instanz in aus Hold-out 8216set8217. Dies ist eine Cross-Validierung. Es würde uns die genaueste Bewertung der Parameter-Kombination, aber in der Praxis 10-fach oder sogar 5-fach ist gut genug. Also, wie tun wir tatsächlich eine Kreuz-Validierung Das libSVM-Paket bei csie. ntu. edu. tw cjlinlibsvm enthält einige Python-Skripte im Tools-Verzeichnis. You8217ll müssen Python und Gnuplot installieren. Sie können auch DeepThought von deep-thought. co. In den Beispielen unten I8217ll verwenden DeepThought. Das erste, was wir brauchen, sind einige Daten. I8217ll verwenden ein Trainingsset mit den folgenden Merkmalen Stunde des Tages Durchschnittliche Schlusskursdifferenz zwischen den vorherigen 30 Balken Gleitende Durchschnittsdifferenzen zwischen den vorherigen 1,2,3,4,5,7,9,13,16,20,25,31 , 45,55,70,100 Balken mit MA-Perioden von 5, 10, 20, 50 und 100 Das Ziel ist -1 für den Preis wird am Ende der nächsten Bar fallen, 1 für den Preis steigen am Ende der Die nächste Leiste. Sobald I8217ve diese in der Konfiguration gesetzt habe, laufe ich den Befehl, um das Trainingsset zu extrahieren. I8217ve auch Min-Max Skalierung verwenden. I8217ll diskutieren Feature Vorbereitung und Skalierung in einem anderen Artikel. Der obige Befehl erstellt Trainingsdateien aus allen Modellen, die in der DeepThought-Konfiguration definiert sind. Nachdem der Befehl eine Datei h4-features. training. data abgeschlossen hat, wird das gleiche Verzeichnis erstellt, dem ich den Befehl ausführte. Dies ist im libSVM-Format, so dass wir die libSVM-Tools verwenden können, um die Raster-Suche auszuführen, oder verwenden Sie Raster-Suche in DeepThought gebaut. Auch die Datei h4-features. training. data. csv, die die gleichen Daten enthält, aber im CSV-Format, so können Sie mit ihm spielen in anderen Werkzeugen wie R, Python, Excel etc. Um die Raster-Suche in DeepThought Ich benutze Der Befehl: Die Ergebnisse befinden sich in der Protokolldatei, wobei Ergebnis: die prozentuale Genauigkeit ist: Die (uninteressanten) Ergebnisse in der Mitte wurden zur Kürze entfernt. Wir können sehen, dass die SVM scheint zu Gunsten kleiner Gammas und die C sieht zu einem vernünftigen Wert. Wir sollten besorgt sein, wenn das beste Gamma groß war und das C klein, da es wahrscheinlich irgendeine Art von Datenfehler bedeutet. Die nächsthöheren Werte sind ungefähr der gleiche Bereich wie die besten Parameter, was anzeigt, daß die Parameterauswahl relativ unempfindlich ist. Wir sollten besorgt sein, wenn die Werte, die das beste Ergebnis liefern, Ausreißer waren. Backtesting der einzelnen SVM-Strategie Der letzte Schritt ist zu bewerten, wie eine einzelne SVM führt in einem Backtest. In diesem Backtest kaufen wir einfach mit einer 1 Prognose und verkaufen mit einer -1 Prognose. Wenn wir lang sind und wir ein Kaufsignal erhalten, fügen wir eine weitere Position zu einer maximalen Positionsgröße von 10 hinzu. Umgekehrt für Verkaufssignale. Unter Verwendung der besten C von 128 und Gamma von 0,00195313 können wir das folgende XML-Snippet aus der Raster-Suchprotokolldatei in die DeepThought-Konfigurationsdatei schneiden: Der Backtest wird mit dem folgenden Befehl ausgeführt: Der DeepThought-Backtest wird durch Erstellen eines Trainingssatzes ausgeführt Dem Schließen jedes Balkens, dem EURUSD H4 in diesem Fall. Wenn das Schließen der nächsten Leiste erreicht ist, wird eine Prognose gemacht und Trades eingegeben und oder geschlossen, dann wird das Modell wieder für die nächste Leiste umgeschult. Damit passt es sich kontinuierlich an die neusten Bedingungen an und alle Tests sind out-of-sample, so dass keine Überanpassung möglich ist. Die Ergebnisse des Backtests waren: und ein Plot der PnL (aufgetragen mit R): Es sieht aussieht ok, aber wahrscheinlich nicht etwas, was wir tun, wie es ist. Der nächste Artikel diskutiert Ensembles zu sehen, ob wir dieses Ergebnis verbessern können.
No comments:
Post a Comment