Warum nimmt die Varianz des Random Walk zu?

28

Die zufällige Wanderung , die definiert ist als Y.t=Y.t-1+et , wobei es sich bei et um weißes Rauschen handelt. Gibt an, dass die aktuelle Position die Summe aus der vorherigen Position und einem unvorhergesehenen Begriff ist.

Sie können beweisen , dass die mittlere Funktion μt=0 , da E(Y.t)=E(e1+e2+...+et)=E(e1)+E(e2)+...+E(et)=0+0+...+0

Aber warum nimmt die Varianz mit der Zeit linear zu?

Hat dies etwas damit zu tun, dass es kein "reiner" Zufall ist, da die neue Position sehr stark mit der vorherigen korreliert?

BEARBEITEN:

Jetzt habe ich ein viel besseres Verständnis, indem ich eine große Stichprobe von zufälligen Wanderungen visualisiere, und hier können wir leicht beobachten, dass die Gesamtvarianz mit der Zeit zunimmt .

100 000 zufällige Spaziergänge

und der Mittelwert liegt wie erwartet bei Null.

Vielleicht war dies doch trivial, da die zufälligen Wanderer in den frühen Phasen der Zeitreihe (vergleiche Zeit = 10, mit 100) noch nicht die Zeit hatten, so viel zu erforschen.

Isbister
quelle
2
Es ist schwer zu erkennen, wie der "Mittelwert" eines simulierten zufälligen Gehens mit der Erwartung eines bestimmten . Diese Erwartung wird per Definition über das gesamte "Ensemble" möglicher zufälliger Spaziergänge berechnet, von denen Ihr simulierter Spaziergang nur eine Instanz ist. Wenn Sie viele Wanderungen simulieren - möglicherweise durch Überlagern der Diagramme auf einem Diagramm -, werden Sie feststellen, dass sie um die horizontale Achse verteilt sind. Wie ändert sich dieser Spread mit t ? Y.tt
Whuber
@whuber das macht mehr Sinn! Natürlich sollte ich es als eine Instanz aller möglichen Wanderungen betrachten. Und dann können Sie anhand des Diagramms sehen, dass die Gesamtvarianz aller Wanderungen mit der Zeit zunimmt. Das ist richtig?
Isbister
1
Ja, das ist richtig. Es ist ein guter Weg, um zu verstehen, was @Glen_b in seiner Antwort mit Mathematik geschrieben hat. Ich habe herausgefunden, dass es hilfreich ist, mit vielen Anwendungen von Zufallsbewegungen vertraut zu sein: Neben der klassischen Brownschen Bewegungsanwendung beschreiben sie die Diffusion, Optionspreise, die Anhäufung von Messfehlern und vieles mehr. Nehmen Sie eine davon, wie Diffusion. Stellen Sie sich einen Tropfen Tinte vor, der in ein Wasserbecken fällt. Obwohl seine Position fixiert ist, breitet sie sich aus wie die Zeit vergeht: so können wir tatsächlich sehen eine ständig Null - Mittelwert zusammen mit zunehmender Varianz.
Whuber
@whuber Vielen Dank, ich verstehe es jetzt total!
Isbister

Antworten:

37

Kurz gesagt, weil es die Varianz der nächsten Schritte zu der Variabilität hinzufügt, die wir haben, um dahin zu gelangen, wo wir jetzt sind.

Var(Y.t)=Var(e1+e2+...+et)
=Var(e1)+Var(e2)+...+Var(et) (Unabhängigkeit)
=σ2+σ2+...+σ2=tσ2,

und wir können sehen, dass tσ2 linear mit t zunimmt .


Der Mittelwert ist zu jedem Zeitpunkt Null; Wenn Sie die Serie viele Male simuliert und über eine bestimmte Zeit gemittelt hätten, wäre dies ein Durchschnitt nahe 0

500 simulierte zufällige Wanderungen mit Mittelwert der Stichprobe und +/- Standardabweichung

Abbildung: 500 simulierte zufällige Spaziergänge mit Stichprobenmittelwert in Weiß und 
± eine Standardabweichung in rot. Die Standardabweichung steigt mit t.

Glen_b - Setzen Sie Monica wieder ein
quelle
Ja, jeder Fehlerbegriff ist ja unabhängig. Und das macht auf dem Papier sicher Sinn. Aber ich bekomme immer noch kein gutes Bauchgefühl für "Wie kann die Varianz linear ansteigen", aber der Mittelwert bleibt Null? Es klingt so komisch, fast wie ein Widerspruch. Wie wäre es mit einer weniger mathematischen Erklärung, die meine Fragen beantwortet?
Isbister
timpal0l - Zu jedem Zeitpunkt fügen Sie einen weiteren Begriff hinzu, der den Mittelwert nicht verschiebt, sondern das "Rauschen" (die Varianz um den Mittelwert) erhöht. Der Mittelwert bleibt also gleich, aber die Varianz nimmt zu (die Verteilung "breitet sich später mehr aus"). Das ist sowohl die intuitive Idee als auch im Allgemeinen das, was die Mathematik zeigt.
Glen_b
1
Danke für das Diagramm, A.Webb . Sehr schön.
Glen_b
15

Hier ist eine Möglichkeit, es sich vorzustellen. Ersetzen Sie zur Vereinfachung Ihr weißes Rauschen durch einen Münzwurf e ieieich

eich={1 mit Pr=.5-1 mit Pr=.5

dies vereinfacht nur die Visualisierung, es gibt nichts wirklich Grundlegendes an dem Schalter, außer unsere Vorstellungskraft zu entlasten.

Angenommen, Sie haben eine Armee von Münzflossen gesammelt. Ihre Anweisungen lauten, auf Ihren Befehl die Münze zu werfen und die Ergebnisse zusammen mit einer Zusammenfassung aller früheren Ergebnisse zu dokumentieren. Jeder einzelne Flipper ist eine Instanz des zufälligen Gehens

W=e1+e2+

Wenn Sie Ihre gesamte Armee zusammenfassen, können Sie das erwartete Verhalten beurteilen.

flip 1W112

flip 2WHHTTW224

...

flip nWHHHTTTnn2n

Folgendes können Sie aus diesem Gedankenexperiment ersehen:

  • Die Erwartung des Gehens ist Null, da jeder Schritt im Gehen ausgeglichen ist.
  • Die Gesamtreichweite der Wanderung wächst linear mit der Länge der Wanderung.

Um die Intuition wiederherzustellen, mussten wir die Standardabweichung verwerfen und den Bereich intuitiv verwenden.

Matthew Drury
quelle
1
Die Standardabweichung wächst nicht linear, so dass die abschließende Bemerkung fraglich ist.
Juho Kokkala
Ja, ich versuche mir etwas auszudenken, um das zu lösen. Irgendwelche Vorschläge? Ich denke nur an den zentralen Grenzwertsatz, der nicht sehr intuitiv ist.
Matthew Drury
@JuhoKokkala Ich stimme Ihrer Kritik zu und habe die letzte Bemerkung entfernt.
Matthew Drury
3

Hat dies etwas damit zu tun, dass es kein "reiner" Zufall ist, da die neue Position sehr stark mit der vorherigen korreliert?

Es scheint, als ob Sie mit "rein" " unabhängig " meinen . Beim zufälligen Gehen sind nur die Schritte zufällig und voneinander unabhängig. Wie Sie bemerkt haben, sind die "Positionen" zufällig, aber korreliert , dh nicht unabhängig .

E[Y.t]=0Y.tY.t

Y.t=Y.0+ich=0tεt

Y.t-Y.t-1=μ+εtY.tμt

Aksakal
quelle
2

Nehmen wir ein anderes Beispiel für eine intuitive Erklärung: Darts auf eine Dartscheibe werfen. Wir haben einen Spieler, der versucht, auf das Bullseye zu zielen. Wir nehmen an, dass es sich um eine Koordinate mit dem Namen 0 handelt. Der Spieler wirft ein paar Mal, und der Mittelwert seiner Würfe ist 0, aber er ist nicht wirklich gut, also die Varianz ist 20 cm.

Wir bitten den Spieler, einen neuen Dart zu werfen. Erwarten Sie, dass es ins Schwarze trifft?

Nein. Obwohl der Mittelwert genau Bullseye ist, ist es ziemlich wahrscheinlich, dass es sich bei einem Wurf nicht um Bullseye handelt.

t

Wenn wir jedoch viele Samples nehmen, werden wir sehen, dass es um 0 zentriert ist. Genau wie unser Dartspieler fast nie das Bullseye trifft (große Varianz), aber wenn er viele Darts wirft, werden sie zentriert sein um das Bullauge (Mittelwert).

Wenn wir dieses Beispiel auf die zufällige Wanderung erweitern, können wir sehen, dass die Varianz mit der Zeit zunimmt, obwohl der Mittelwert bei 0 bleibt. Im Fall der zufälligen Wanderung erscheint es seltsam, dass der Mittelwert bei 0 bleibt, obwohl Sie es intuitiv wissen dass es fast nie genau am Ursprung landet. Gleiches gilt jedoch für unseren Darter: Wir können feststellen, dass fast nie ein einzelner Pfeil mit zunehmender Varianz auf das Bullseye trifft, und dennoch bilden die Darts eine schöne Wolke um das Bullseye - der Mittelwert bleibt derselbe: 0.

Sanchises
quelle
1
Dies beschreibt nicht das Phänomen der Frage, das die zeitliche Zunahme der Ausbreitung betrifft . Dieser Anstieg hängt nicht von der Anzahl der Proben ab. Es ist immanent.
Whuber
1
t
0

Hier ist ein anderer Weg, um eine Vorstellung davon zu bekommen, dass die Varianz linear mit der Zeit zunimmt.

.1%1.2%X365X

.1%±.05%1.2%±.6%

Wenn wir uns Varianz intuitiv als Bereich vorstellen, dann ist es intuitiv sinnvoll, dass die Varianz auf dieselbe Weise zunimmt wie die Rückkehr durch die Zeit, dh linear.

Plalud
quelle