Ist die Gaußsche Verteilung die richtige Wahl für einen Schritt in finanziellen Zeitreihen? Z.B. DJIA ROI schlägt stattdessen Laplace vor

0

Datenkomprimierung verwendet Laplace-Verteilung ($ \ rho = \ exp (- | x- \ mu | / b) / 2b $) für die Wahrscheinlichkeitsverteilung von Unterschieden, während ich sehe, dass die Wirtschaft überall eine Gaußsche Verteilung (?) verwendet, z.B. In ARIMA-ähnlichen Modellen - was könnte aufgrund des zentralen Grenzwertsatzes die richtige Wahl für Unterschiede über lange Zeiträume (?) sein, aber nicht unbedingt für kurze.

Ich habe kürzlich gearbeitet mit einer Länge von ~ 30000 (100+ Jahre) Dow Jones - tägliche durchschnittliche Zeitreihe. Betrachten Sie den ROI: $ x (t) = \ lg (v (t + 1)) - \ lg (v (t)) $, sortieren Sie diese Werte, um angenäherte CDF (blau) zu erhalten, und vergleichen Sie sie mit der CDF des geschätzten Gaussian (grau) ) und Laplace (rot) Verteilung erhalten wir:

enter image description here

Wir können sehen, dass die Verteilung von Laplace hier viel besser übereinstimmt als Gaußsche.

Mathematica-Quelle (Testen Sie Ihre Daten): sv = Sort [val]; lc = Länge [val]; cdfe =  Tabelle [{sv [[i]], (i - 0,5) / lc}, {i, lc}]; mu = Median [val]; b =  Mittelwert [Abs [val - mu]]; Mittelwert = Mittelwert [Wert]; Sigma =  Sqrt [Abweichung [val]]; Show [ListPlot [cdfe, Joined - & gt; Wahr],  Plot [{CDF [LaplaceDistribution [mu, b], x]    CDF [NormalDistribution [Mittelwert, Sigma], x]}, {x, -0,1, 0,1},   PlotStyle - & gt; {{Dünn, Rot}, {Grau}}]]]

Später Ich habe daran gearbeitet Schätzung als Polynom der gemeinsamen Verteilung der Differenzen von Parametern der Zinsstrukturkurven in Diebold-Li Modell: $ \ beta_i (t + 1) - \ beta_i (t) $. Für $ i = 1,2 $, wobei jede Variable auf $ [0,1] $ (unter Verwendung der Laplace-Verteilung von CDF) nahezu einheitlich ist, werden hier Punkte (winziges Schwarz) und Isolinien ihrer Dichte als Polynom 9 (100) geschätzt Koeffizienten) - wir sehen, dass ihre Wahrscheinlichkeitsverteilung nicht einmal unimodal ist:

enter image description here

Gibt es eine andere Verteilung als die Gaußsche Verteilung für Daten in wirtschaftlicher Literatur?

Sind Abweichungen von der Gaußschen Verteilung wie oben häufig?

Können sie für weitere Analysen entscheidend sein?

Jarek Duda
quelle
1
Ich folge nicht dem, was Sie mit der Renditekurve gemacht haben, aber im Hinblick auf die Eigenkapitalbeteiligung haben die Menschen seit mindestens 1900 versucht, die zugrunde liegende Verteilung der Aktienrenditen zu ermitteln. Ich würde mir Benoit Mandelbrots Arbeit ansehen. Er war ein kluger unkonventioneller Denker, der angeblich die größten Fortschritte gemacht hatte, um die zugrunde liegende Verteilung herauszufinden. Beachten Sie auch, dass strukturelle Änderungen eintreten können, sodass im Falle eines Tageshorizonts 30.000 Tage Rendite zusammengezählt werden können und die Berücksichtigung des cdf möglicherweise nicht sinnvoll ist.
mark leeds
Die empirische CD wurde durch Sortieren der Werte wie in der Quelle erhalten. Für Laplace und Gauß verwenden sie geschätzte MLE-Parameter. Stationarität dieser Zeitreihe ist eine andere Frage - die Koeffizienten, die ich verwende, zeigen, dass es nicht stationär ist, aber der allgemeine Dokumententext scheint ähnlich zu sein. Ich habe einige Familien ausprobiert: de.wikipedia.org/wiki/Generalized_normal_distribution (enthält Gaussian und Laplace) und Levy: de.wikipedia.org/wiki/Stable_distribution ... und Laplace scheint hier eine wirklich gute Wahl zu sein, was "allgemeines Wissen" bei der Datenkomprimierung ist, z. de.wikipedia.org/wiki/Lossless_JPEG
Jarek Duda
Hi: Ich bin nicht klar über deinen Kommentar zur Stationarität, weil ich dachte, du nimmst nur die tatsächlichen Renditen und baust die Cdf daraus auf. Wenn dies nicht der Fall ist und Sie dies näher erläutern möchten, starten Sie möglicherweise einen anderen Thread, da mir nicht klar ist, wie der CDF erstellt wurde. Aber das ist sowieso nicht mein Punkt. Mein Punkt war, dass die Schätzung eines CDF einen unbekannten konstanten Mittelwert und eine Varianz des Basiswerts über den ausgewählten Zeitraum impliziert. Die Möglichkeit eines strukturellen Wandels macht diese Annahme sehr unwahrscheinlich. Sehen Sie sich Mandelbrots Material für seine Techniken an.
mark leeds
Ich wollte hier nicht in die Stationarität einsteigen, aber der Aufbau empirischer Dokumente in Zeitfenstern sieht ähnlich aus - in der Nähe von Laplace, nicht in der Nähe von Gauß. In Bezug auf das Erstellen von empirischen cdf sind v (t) 30000 DJIA-Werte, x (t) = In (v (t + 1)) - In (v (t)). Dann sei {y [t]} sortiert x [t] - dann ist (y [t], t / T) die blaue Linie in der Grafik: de.wikipedia.org/wiki/Empirical_distribution_function
Jarek Duda
1
Hallo Jarek: Ich habe nur sehr schnell einen Blick darauf geworfen, aber dieser Link könnte Ihnen eine etwas neuere (2004) Zusammenfassung der Renditeverteilungen im Finanzbereich geben. nr.no/files/samba/bff/SAMBA0804.pdf
mark leeds