Ich mache einige beschreibende Statistiken über die täglichen Renditen von Aktienindizes. Das heißt, wenn und die an Tag 1 bzw. Tag 2 sind, dann ist die Rendite, die ich verwende (in der Literatur völlig Standard).
In einigen Fällen ist die Kurtosis also enorm. Ich betrachte ungefähr 15 Jahre tägliche Daten (also ungefähr Zeitreihenbeobachtungen)
means sds mins maxs skews kurts
ARGENTINA -0.00031 0.00965 -0.33647 0.13976 -15.17454 499.20532
AUSTRIA 0.00003 0.00640 -0.03845 0.04621 0.19614 2.36104
CZECH.REPUBLIC 0.00008 0.00800 -0.08289 0.05236 -0.16920 5.73205
FINLAND 0.00005 0.00639 -0.03845 0.04622 0.19038 2.37008
HUNGARY -0.00019 0.00880 -0.06301 0.05208 -0.10580 4.20463
IRELAND 0.00003 0.00641 -0.03842 0.04621 0.18937 2.35043
ROMANIA -0.00041 0.00789 -0.14877 0.09353 -1.73314 44.87401
SWEDEN 0.00004 0.00766 -0.03552 0.05537 0.22299 3.52373
UNITED.KINGDOM 0.00001 0.00587 -0.03918 0.04473 -0.03052 4.23236
-0.00007 0.00745 -0.09124 0.06405 -1.82381 63.20596
AUSTRALIA 0.00009 0.00861 -0.08831 0.06702 -0.74937 11.80784
CHINA -0.00002 0.00072 -0.40623 0.02031 6.26896 175.49667
HONG.KONG 0.00000 0.00031 -0.00237 0.00627 2.73415 56.18331
INDIA -0.00011 0.00336 -0.03613 0.03063 -0.22301 10.12893
INDONESIA -0.00031 0.01672 -0.24295 0.19268 -2.09577 54.57710
JAPAN 0.00008 0.00709 -0.03563 0.06591 0.57126 5.16182
MALAYSIA -0.00003 0.00861 -0.35694 0.13379 -16.48773 809.07665
Meine Frage ist: Gibt es ein Problem?
Ich möchte eine umfassende Zeitreihenanalyse über diese Daten durchführen - OLS- und Quantil-Regressionsanalyse sowie Granger-Kausalität.
Sowohl meine Antwort (abhängig) als auch mein Prädiktor (Regressor) haben die Eigenschaft einer gigantischen Kurtosis. Ich werde diese Rückgabeprozesse also auf beiden Seiten der Regressionsgleichung haben. Wenn die Nicht-Normalität auf die Störungen übergreift, werden meine Standardfehler nur eine hohe Varianz aufweisen, oder?
(Vielleicht brauche ich einen schräg gestellten robusten Bootstrap?)
Antworten:
Probieren Sie die Lambert W x F- Distributionen mit schwerem Schwanz oder die verzerrten Lambert W x F- Distributionen aus (Haftungsausschluss: Ich bin der Autor). In R sind sie im LambertW- Paket implementiert .
Zusammenhängende Posts:
Ein Vorteil gegenüber der Cauchy- oder Student-t-Verteilung mit festen Freiheitsgraden besteht darin, dass die Endparameter aus den Daten geschätzt werden können - so können Sie die Daten entscheiden lassen, welche Momente existieren. Darüber hinaus können Sie mit dem Lambert W x F-Framework Ihre Daten transformieren und Schiefe / schwere Schwänze entfernen. Es ist jedoch wichtig zu beachten, dass OLS keine Normalität von oder erfordert . Für Ihre EDA könnte es sich jedoch lohnen.X.y X
Hier ist ein Beispiel für Lambert W x Gaussian-Schätzungen, die auf die Rendite von Aktienfonds angewendet werden.
Die zusammenfassenden Metriken der Renditen sind ähnlich (nicht so extrem) wie in OPs Beitrag.
Die meisten Serien zeigen deutlich nicht normale Eigenschaften (starke Schiefe und / oder große Kurtosis). Lassen Sie uns jede Reihe unter Verwendung einer Lambert W x Gaußschen Verteilung mit schwerem Schwanz (= Tukey's h) unter Verwendung einer Methode des Momentenschätzers (
IGMM
) Gaußschisieren .Die Zeitreihendiagramme zeigen viel weniger Schwänze und auch eine stabilere zeitliche Variation (jedoch nicht konstant). Die erneute Berechnung der Metriken für die Gaußschen Zeitreihen ergibt:
Der3
IGMM
Algorithmus hat genau das erreicht, was er wollte: die Daten so transformieren, dass eine Kurtosis von vorliegt . Interessanterweise weisen alle Zeitreihen jetzt eine negative Schiefe auf, was mit der meisten Literatur zu Finanzzeitreihen übereinstimmt. Es ist wichtig darauf hinzuweisen, dass dies nur am Rande funktioniert, nicht gemeinsam (analog zu ).Gaussianize()
scale()
Einfache bivariate Regression
Um die Auswirkung der Gaußschen Methode auf OLS zu berücksichtigen, sollten Sie die "EASTEU" -Rendite aus "INDIA" -Renditen vorhersagen und umgekehrt. Obwohl wir die Renditen am selben Tag zwischen und (keine verzögerten Variablen), liefert sie angesichts des Zeitunterschieds von 6 Stunden + zwischen Indien und Europa immer noch einen Wert für eine Börsenprognose. r I N D I A , trEASTEU,t rINDIA,t
Das linke Streudiagramm der Originalserie zeigt, dass die starken Ausreißer nicht an denselben Tagen, sondern zu unterschiedlichen Zeiten in Indien und Europa auftraten. Ansonsten ist nicht klar, ob die Datenwolke in der Mitte keine Korrelation oder negative / positive Abhängigkeit unterstützt. Da Ausreißer die Varianz- und Korrelationsschätzungen stark beeinflussen, lohnt es sich, die Abhängigkeit bei entfernten schweren Schwänzen zu betrachten (rechtes Streudiagramm). Hier sind die Muster viel klarer und die positive Beziehung zwischen Indien und dem osteuropäischen Markt wird deutlich.
Granger-Kausalität
Ein Granger-Kausaltest basierend auf einem -Modell (ich verwende , um den Wocheneffekt des täglichen Handels zu erfassen) für "EASTEU" und "INDIA" lehnt "keine Granger-Kausalität" für beide Richtungen ab.p = 5VAR(5) p=5
Für die Gaußschen Daten ist die Antwort jedoch anders! Hier kann der Test H0 nicht ablehnen, dass "INDIEN kein Granger verursacht EASTEU", aber dennoch ablehnt, dass "EASTEU kein Granger verursacht INDIEN". Die Gaußschen Daten stützen also die Hypothese, dass die europäischen Märkte am nächsten Tag die Märkte in Indien antreiben.
Beachten Sie, dass mir nicht klar ist, welche die richtige Antwort ist (falls vorhanden), aber es ist eine interessante Beobachtung. Es ist unnötig zu erwähnen, dass dieser gesamte Kausaltest davon abhängt, dass der das richtige Modell ist - was höchstwahrscheinlich nicht der Fall ist. aber ich denke, es dient gut zur Veranschaulichung.VAR(5)
quelle
Was benötigt wird, ist ein Wahrscheinlichkeitsverteilungsmodell, das besser zu den Daten passt. Manchmal gibt es keine definierten Momente. Eine solche Verteilung ist die Cauchy-Verteilung. Obwohl die Cauchy-Verteilung einen Median als erwarteten Wert hat, gibt es keinen stabilen Mittelwert und keine stabilen höheren Momente. Dies bedeutet, dass beim Sammeln von Daten tatsächliche Messungen auftreten, die wie Ausreißer aussehen, aber tatsächliche Messungen sind. Wenn man beispielsweise zwei Normalverteilungen F und G mit dem Mittelwert Null hat und man F / G teilt, hat das Ergebnis keinen ersten Moment und ist eine Cauchy-Verteilung. Wir sammeln also gerne Daten und es sieht in Ordnung aus wie 5,3,9,6,2,4 und wir berechnen einen Mittelwert, der stabil aussieht. Dann erhalten wir plötzlich einen Wert von -32739876 und unser Mittelwert wird bedeutungslos. Beachten Sie jedoch, dass der Median 4 beträgt und stabil ist. So ist es bei Long-Tailed-Distributionen.
Bearbeiten: Sie können die Student-T-Verteilung mit 2 Freiheitsgraden ausprobieren. Diese Verteilung hat längere Schwänze als die Normalverteilung, die Schiefe und die Kurtosis sind instabil ( Sic , existieren nicht), aber der Mittelwert und die Varianz sind definiert, dh sie sind stabil.
Nächste Änderung: Eine Möglichkeit könnte darin bestehen, die Theil-Regression zu verwenden. Wie auch immer, es ist ein Gedanke, denn Theil wird gut funktionieren, egal wie die Schwänze aussehen. Sie können MLR (multiple lineare Regression unter Verwendung von Mediansteigungen) durchgeführt werden. Ich habe Theil noch nie für die Anpassung von Histogrammdaten durchgeführt. Aber ich habe Theil mit einer Jackknife-Variante gemacht, um Konfidenzintervalle festzulegen. Dies hat den Vorteil, dass Theil sich nicht um die Verteilungsformen kümmert und die Antworten im Allgemeinen weniger voreingenommen sind als bei OLS, da OLS normalerweise verwendet wird, wenn eine problematische Varianz der unabhängigen Achse vorliegt. Nicht dass Theil völlig unbefangen ist, es ist eine mittlere Steigung. Die Antworten haben auch eine andere Bedeutung. Sie finden eine bessere Übereinstimmung zwischen den abhängigen und unabhängigen Variablen, wobei OLS den Prädiktor für den geringsten Fehler der abhängigen Variablen findet.
quelle