Welcher Algorithmus für maschinelles Lernen kann verwendet werden, um den Aktienmarkt vorherzusagen?

15

Alternativ zur Vorhersage von Devisenmärkten. Ich weiß, dass dies ziemlich kompliziert werden kann, daher suche ich zur Einführung einen einfachen Vorhersagealgorithmus mit einer gewissen Genauigkeit.

(Es ist für ein M.Sc.-Universitätsprojekt, das vier Monate dauert)

Ich habe gelesen, dass ein mehrschichtiges neuronales Netzwerk nützlich sein könnte. Irgendwelche Gedanken dazu? Darüber hinaus kann die semantische Analyse sozialer Medien Einblick in das Marktverhalten geben, das den Aktienmarkt beeinflusst. Die semantische Analyse liegt derzeit jedoch etwas außerhalb des Projektumfangs.

siamii
quelle
15
Meins, aber aus offensichtlichen Gründen behalte ich alles für mich!
babelproofreader 20.01.12
7
Wenn man der Hypothese eines effizienten Marktes glaubt, ist es unmöglich, konstant überdurchschnittliche Marktrenditen zu erzielen (ohne Insiderwissen), das in die aktuellen Kurse / Preise eingebaut ist. Viele Menschen sind damit nicht einverstanden, aber fast alle sind sich einig, dass dies für einen Gelegenheitsinvestor zutrifft. Mit anderen Worten, ein 3-Zeilen-Modell basierend auf rand () ist wahrscheinlich fast so gut wie der typische Investor: P
rm999 20.01.12
5
Es ist unwahrscheinlich, dass jemand bereit ist, einen Algorithmus mit einer Genauigkeit zu verwenden, die außerhalb der Stichprobe liegt. Ausgenommen vielleicht einige veröffentlichte wissenschaftliche Arbeiten, bei denen die Anomalie gering ist und die Transaktionskosten nicht abdeckt.
NPE
2
Für akademische Arbeiten ist es möglicherweise sinnvoller, die Preise zu modellieren, als sie vorherzusagen. Die Vorhersage wird sich wahrscheinlich als erfolglos erweisen, aber die Modellierung könnte zumindest einen Einblick in die tatsächliche Funktionsweise geben und theoretisch auf die Vorhersage ausgeweitet werden.
highBandWidth
2
@wayne Ich denke nicht, dass es um Überanpassung geht. Es geht darum, Prädiktoren zuzulassen, die nicht für Vorhersagen verwendet werden können, zum Beispiel Variablen, die während / nach Aktienbewegungen auftreten msft lager vorherzusagen kann aber sehr informativ sein.
RM999,

Antworten:

17

Wie babelproofreader bereits erwähnt hat , sind diejenigen, die einen erfolgreichen Algorithmus haben, in der Regel sehr geheim. Daher ist es unwahrscheinlich, dass ein allgemein verfügbarer Algorithmus von Anfang an sehr nützlich ist, es sei denn, Sie machen etwas Gescheites daraus (ab diesem Zeitpunkt ist er nicht mehr allgemein verfügbar, seit Sie ihn erweitern).

Das Erlernen von ARIMA-Modellen (Autoregressive Integerated Moving Average) könnte ein nützlicher Anfang für die Vorhersage von Zeitreihendaten sein. Erwarten Sie jedoch keine besseren als zufälligen Ergebnisse.

Michael McGowan
quelle
5
+1: Wie oft habe ich gelesen oder war in einer Klasse und habe gehört, dass Menschen, die glauben, dass sie einen komplizierten Algorithmus haben, an den Aktien-, Strom- und Rohstoffmärkten reich werden könnten. Sie versuchen, Überanpassung usw. zu erklären, aber ohne Erfolg. Soweit ich weiß, war eine erfolgreiche Börsenhandelssoftware kein Insider, sondern von keinerlei Transaktionsgebühren, Arbitrage und hoher Geschwindigkeit abhängig. Die Schneide ist jetzt, Schlupflöcher in automatisierten Handelsregeln zu verwenden und Gebote schnell vorzuschlagen / zurückzuziehen, um andere automatisierte Händler zu schlagen.
Wayne
1
Das andere Problem ist, dass mehrere Personen den gleichen Algorithmus verwenden, weil sie mit genau den gleichen Daten trainiert haben und dann Volumenverkäufe / -käufe durchgeführt haben. Wäre von einem Algorithmus eine langfristige Genauigkeit zu erwarten?
Michelle
@Wayne Es gibt Strategien zur Reduzierung von Überanpassungen, die sich jedoch nur schwer in Zeitreihendaten implementieren lassen.
Zach
1
@Zach: Ja, es gibt Möglichkeiten, Überanpassung zu bestrafen, aber ich denke über diese Einstellung nach: die Leute, die eine grundlegende (wahrscheinlich fehlerhafte) Kurvenanpassung in Excel vorgenommen haben und das Gefühl haben, mit ihrer geheimen Sauce Geld verdient zu haben , aber was sie wirklich brauchen, ist einer dieser hochmodernen, hoch entwickelten Algorithmen, die der Professor einfach nicht mit der Klasse teilt. Dieser Algorithmus passte wie angegossen zu den Daten und sagte dann so viel besser voraus als alle anderen Spekulanten, die Excel-Tabellen verwenden ... aber der Professor schwärmt weiter von Überanpassung und den Einschränkungen der Daten. Seufzer.
Wayne
12

Ich denke, für Ihre Zwecke sollten Sie einen Algorithmus für maschinelles Lernen auswählen, den Sie interessant finden, und ihn ausprobieren.

In Bezug auf eine effiziente Markttheorie sind die Märkte in keiner Zeitskala effizient. Einige Leute (sowohl im akademischen Bereich als auch im realen Leben) sind von der intellektuellen Herausforderung motiviert, nicht nur schnell reich zu werden, und sie veröffentlichen interessante Ergebnisse (und ich zähle ein fehlgeschlagenes Ergebnis als interessant). Aber behandeln Sie alles, was Sie lesen, mit einer Prise Salz. Wenn die Ergebnisse wirklich gut sind, ist dies möglicherweise nicht die wissenschaftliche Methode.

Data Mining mit R könnte ein nützliches Buch für Sie sein. es ist teuer, also versuche es in deiner Universitätsbibliothek zu finden. Kapitel 2 behandelt genau das, was Sie tun möchten, und er erzielt die besten Ergebnisse mit einem neuronalen Netz. Aber seien Sie gewarnt, dass er schlechte Ergebnisse erzielt und viel CPU-Zeit dafür verwendet. Die Amazon-Rezensionen weisen darauf hin, dass das Buch 20 US-Dollar mehr kostet, da in diesem Kapitel das Wort Finanzen erwähnt wird . Als ich es las, hatte ich den Eindruck, dass der Verlag ihn dazu gedrängt hatte, es zu schreiben. Er hat seine Hausaufgaben gemacht, die Dokumente gelesen, die richtigen Mailinglisten durchgesehen, aber sein Herz war nicht dabei. Ich habe ein paar nützliche R-Kenntnisse davon, werde aber den Markt nicht schlagen :-)

Darren Cook
quelle
@ Darren - Ich mag deinen Stil.
Rolando2
1
Eine Entwurfsversion (Mai 2003) von Data Mining mit R finden Sie hier . (Ich habe das Buch nicht, daher kann ich nicht sagen, wie
groß
@chi Danke! Ich habe einen kurzen Blick darauf geworfen, und von den vier Kapiteln sind nur zwei vorhanden. Der größere Unterschied besteht jedoch darin, dass das Kapitel Prognose der Aktienmarktrenditen sehr unterschiedlich ist. Keine Erwähnung von xts oder quantmod und stattdessen Verwendung des ts-Pakets und Verwendung von acf und des MARS-Pakets für Vorhersagen. Es ist fast wie ein Bonuskapitel, und ich werde mir die Zeit nehmen, es richtig zu lesen. Er verwendet immer noch neuronale Netze, vergleicht sie jedoch nicht mit SVMs wie im veröffentlichten Buch.
Darren Cook
10

Meiner Meinung nach kann jede gewöhnliche starke KI, die all die folgenden Möglichkeiten bietet, leicht eine statistisch signifikante Vorhersage liefern:

  • Sammle und verstehe Gerüchte

  • Zugriff auf und Interpretation aller Regierungskenntnisse

  • Tun Sie dies in jedem relevanten Land

  • Machen Sie relevante Vorhersagen über:

    • Wetterverhältnisse

    • Terroristische Aktivitäten

    • Gedanken und Gefühle von Individuen

    • Alles andere, was den Handel betrifft

Die statistische Analyse ist die geringste Sorge, die Sie haben.

Jon Purdy
quelle
4

Sie könnten die Funktionen auto.arima und ets in R ausprobieren. Möglicherweise haben Sie auch einige Erfolge mit dem Paket rugarch , es gibt jedoch keine Funktionen für die automatische Parameterauswahl. Vielleicht könnten Sie Parameter für das mittlere Modell abrufen auto.arima, sie dann übergeben rugarchund hinzufügengarch(1,1) ?

Es gibt alle möglichen Blogs, die behaupten, dass dies erfolgreich ist. Hier ist ein System, das ein Arima-Modell (und später ein Garch-Modell) verwendet, und ein System, das ein SVM-Modell verwendet . Sie finden viele gute Informationen zum FOSS-Handel , besonders wenn Sie die Blogs auf seiner Blogroll lesen.

Unabhängig davon, welches Modell Sie verwenden, sollten Sie eine Kreuzvalidierung und einen Benchmark durchführen! Es würde mich sehr wundern, wenn Sie ein Arima-, Ets- oder gar Garch-Modell finden würden, das ein naives Modell durchweg aus der Stichprobe schlagen könnte . Beispiele für die Kreuzvalidierung von Zeitreihen finden Sie hier und hier . Denken Sie daran, dass Sie WIRKLICH Renditen prognostizieren möchten, nicht Preise.

Zach
quelle
2

Ich kenne einen Ansatz für maschinelles Lernen, der derzeit von mindestens einem Hedgefonds verwendet wird. numer.ai verwendet ein Ensemble von vom Benutzer bereitgestellten Algorithmen für maschinelles Lernen, um die Aktionen des Fonds zu steuern.

Mit anderen Worten: Ein Hedgefonds bietet offenen Zugang zu einer verschlüsselten Version von Daten über ein paar Hundert Anlageinstrumente, höchstwahrscheinlich Aktien. Tausende von Datenwissenschaftlern und dergleichen trainieren alle Arten von Algorithmen für maschinelles Lernen anhand dieser Daten und laden die Ergebnisse auf eine Anzeigetafel hoch. Die Besten erhalten einen kleinen Geldbetrag, abhängig von der Genauigkeit ihrer Ergebnisse und davon, wie lange ihr Ergebnis online verfügbar war.

Die besten Vorhersagen werden angeblich von Algorithmen-Ensembles getroffen.

Es gibt also eine Menge Wissenschaftler, die geschulte Vermutungen anstellen, von denen einige selbst Vermutungen sind, und der Hedgefonds verwendet das Ensemble aller zur Verfügung gestellten Vermutungen, um ihre Investitionen zu steuern.

Die Ergebnisse dieses ziemlich interessanten Hedgefonds haben mir zwei Dinge beigebracht:

  1. Ensembles werden oft als ein guter Weg angesehen, um Vorhersagen an der Börse zu treffen.
  2. Gute Vorhersagen erfordern mehr Ensembles, als ich bereit bin, mich selbst aufzubauen ...

Wenn Sie es ausprobieren möchten, besuchen Sie: https://numer.ai/ Nein, ich bin NICHT mit ihnen verbunden. Wahrscheinlich würde ich meine Tage nicht online verbringen, wenn ich mit einem Hedgefonds verbunden wäre, der Tausende von Menschen beschäftigt , aber nur diejenigen bezahlen, die messbare Ergebnisse liefern :)

Die numer.ai-Community verfügt über ein Forum, in dem sie ihre Vorgehensweise bespricht, sodass Sie von anderen lernen können, die versuchen, dasselbe zu tun.

Persönlich denke ich, dass jeder mit einem guten Algorithmus es sehr, sehr geheim halten wird.

Beyer
quelle
1

Sie sollten neuronale Netze vom Typ GMDH ausprobieren. Ich weiß, dass es einige erfolgreiche kommerzielle Pakete für die Börsenprognose verwenden, erwähne es aber nur in den Tiefen der Dokumentation. Kurz gesagt handelt es sich um ein mehrschichtiges iteratives neuronales Netzwerk, sodass Sie auf dem richtigen Weg sind.

BrutForce
quelle
0

Ich denke, versteckte Markov-Modelle sind an der Börse sehr beliebt. Das Wichtigste, das Sie beachten sollten, ist, dass Sie einen Algorithmus benötigen, der den zeitlichen Aspekt Ihrer Daten bewahrt.

Roronoa Zoro
quelle