Um diese Frage genauer zu erläutern, werde ich zunächst meinen Ansatz erläutern:
- Ich simulierte eine Folge unabhängiger Zufallszahlen .
Ich nehme dann mal den Unterschied; dh ich erstelle die Variablen:
Ich beobachte, dass die (absolute) Autokorrelation von zunimmt, wenn größer wird; Der Wechselstrom nähert sich sogar 0,99 für . Das heißt, wenn wir die L-te Differenzordnung nehmen, erzeugen wir eine Reihe stark abhängiger Zahlen (Sequenzen) aus einer anfänglich unabhängigen Sequenz.
Hier sind einige Grafiken, um meine Beobachtungen zu veranschaulichen:
Meine Fragen:
Gibt es eine Theorie hinter diesem Ansatz und seinen Implikationen oder Anwendungen für ihn?
Zeigt dies an, dass dieser Ansatz die Schwächen eines Pseudozufallsgenerators (des Computers) ausnutzt. Dh die erzeugte "zufällige" Sequenz ist nicht völlig zufällig, und dies wird durch meinen Ansatz veranschaulicht / bewiesen?
Können wir die hohe Autokorrelation der L-ten Ordnung von Differenzen ausnutzen, um die nächste Zahl in der Sequenz vorherzusagen (dh )? Das heißt, wenn wir die nächste Anzahl von vorhersagen können (z. B. durch lineare Regression), können wir die geschätzte Sequenz zurückleiten, indem wir das fache der kumulativen Summe nehmen. Ist das ein praktikabler Ansatz?
Ziel Beachten Sie, dass ich versuche, vorherzusagen , aber da die Zahlen unabhängig und zufällig generiert werden, ist dies sehr schwierig (niedriger Wechselstrom von ).
quelle
Antworten:
Theorie
Wenn die Autokorrelation eine Bedeutung haben soll, müssen wir annehmen, dass die ursprünglichen Zufallsvariablen dieselbe Varianz haben, die wir - durch eine geeignete Wahl der Maßeinheiten - auf Eins setzen können. Aus der Formel für die endliche DifferenzX.0,X.1, … ,X.N. L.th
für und die Unabhängigkeit des berechnen wir leicht0 ≤ i ≤ N.- L. X.ich
und für und ,0 < j < L i ≤ N.- L - j
Dividieren nach gibt die lag- serielle Korrelation . Es ist negativ für ungerade und positiv für gerade .( 2 ) ( 1 ) j ρj j j
Stirlings Formel liefert eine leicht interpretierbare Annäherung
In Abhängigkeit von seine Größe ungefähr eine Gaußsche ("glockenförmige") Kurve, wie wir es von jedem diffusionsbasierten Verfahren wie aufeinanderfolgenden Differenzen erwarten würden. Hier ist eine Darstellung vondurchals Funktion von , die zeigt, wie schnell sich die serielle Korrelation nähert . In der Reihenfolge von oben nach unten stehen die Punkte fürdurch.j |ρ1| |ρ5| L. 1 |ρ1| |ρ5|
Schlussfolgerungen
Da es sich um rein mathematische Beziehungen handelt, verraten sie wenig über das . Da alle endlichen Differenzen lineare Kombinationen der ursprünglichen Variablen sind, liefern sie insbesondere keine zusätzlichen Informationen, die zur Vorhersage von aus .Xi XN+1 X0,X1,…,XN
Praktische Beobachtungen
Wenn wächst, wachsen die Koeffizienten in den linearen Kombinationen exponentiell. Beachten Sie, dass jedes eine alternierende Summe ist: Insbesondere erscheinen in der Mitte dieser Summe relativ große Koeffizienten in der Nähe von . Betrachten Sie die tatsächlichen Daten, die ein wenig zufälligem Rauschen ausgesetzt sind. Dieses Rauschen wird mit diesen großen Binomialkoeffizienten multipliziert, und dann werden diese großen Ergebnisse durch abwechselnde Addition und Subtraktion nahezu aufgehoben . Infolgedessen werden solche endlichen Differenzen für große berechnetL X(L)i (LL/2) L neigt dazu, alle Informationen in den Daten zu löschen und spiegelt nur winzige Mengen an Rauschen wider, einschließlich Messfehler und Gleitkomma-Rundungsfehler. Die offensichtlichen Muster in den Unterschieden, die in der Frage für und liefern mit ziemlicher Sicherheit keine aussagekräftigen Informationen. (Die Binomialkoeffizienten für werden so groß wie und so klein wie , was bedeutet, dass ein Gleitkommafehler mit doppelter Genauigkeit die Berechnung dominieren wird.)L=100 L=168 L=100 1029 1
quelle
Dies ist eher ein Kommentar oder bestenfalls ein weiterer Hinweis zur Lösung Ihrer Frage, aber mein Ruf erlaubt mir nicht, Kommentare zu veröffentlichen.
Ich habe Ihr Experiment in Stata mithilfe von Zeichnungen aus einem Standardnormal mit dem folgenden Code repliziert:
Als ich mir die Korrelogramme der differenzierten Variablen ansah, fragte ich mich, warum die Konfidenzbänder so klein sind. Ich habe noch nie so kleine Konfidenzbänder in einem Stata-Korrelogramm gesehen. Irgendwelche Ideen?
Ich dachte, dies könnte ein Hinweis sein, denn bei so kleinen Konfidenzbändern werden sogar die winzigen Autokorrelationen aus den am weitesten entfernten Verzögerungen in Ihrer absoluten Autokorrelation gezählt, wenn ich "absolut" richtig interpretiere.
Hier ist das Korrelogramm für meinen dX_10 ...
... und hier ist es wieder, vergrößert auf die ersten 10 Verzögerungen ...
quelle
Dies wird erwartet, da die Unterschiede nicht unabhängig voneinander sind. Zum Beispiel ist direkt proportional zu während umgekehrt proportional zuDa die Definitionen aufeinanderfolgender Elemente von Elemente von auf diese umgekehrte Weise gemeinsam nutzen, erwarten wir, dass sie umgekehrt miteinander korreliert sind. wir zu Unterschieden höherer Ordnung , teilen aufeinanderfolgende Werte einen immer höheren Anteil der Elemente von , die in ihre Definition , und ihre Antikorrelation nimmt zu. Wenn wir das gemeinsame Element jedoch nicht kannten (dX1(1)≡X(2)−X(1) X(2) dX1(2)≡X(3)−X(2) X(2). dX1 X dXi X X(2) in meinem Beispiel) könnten wir keine Unterschiede berechnen, die dieses Element enthalten. Wir können daher die Antikorrelationen in den Unterschieden nicht verwenden, um unbekannte Elemente von vorherzusagen, wenn sie unabhängig von den bekannten Elementen erzeugt werden.X
quelle