Ist eine Zeitreihe dasselbe wie ein stochastischer Prozess?

27

Ein stochastischer Prozess ist ein Prozess, der sich im Laufe der Zeit entwickelt. Ist es also wirklich eine schickere Art, "Zeitreihen" zu sagen?

Sieger
quelle
10
Eine Zeitreihe ist ein stochastischer Prozess mit zeitdiskreter Beobachtung. Ein stochastischer Prozess kann in kontinuierlicher Zeit beobachtet werden. (Es kann auch sein, dass Serien eher mit Beobachtungen und stochastischen Prozessen mit dem zufälligen Objekt zusammenhängen.)
Xi'an
"Reihen" implizieren eine diskrete oder endliche Natur im Gegensatz zur potentiell kontinuierlichen Natur des "Prozesses".
Aksakal
7
Ein stochastischer Prozess muss nicht entwickeln im Laufe der Zeit; es könnte stationär sein. Meiner Meinung nach ist der Unterschied zwischen stochastischem Prozess und Zeitreihen ein Gesichtspunkt. Ein stochastischer Prozess ist eine Sammlung von Zufallsvariablen, während eine Zeitreihe eine Sammlung von Zahlen oder eine Realisierung oder ein Beispielpfad eines stochastischen Prozesses ist. Mit zusätzlichen Annahmen über den Prozess möchten wir möglicherweise das Histogramm der Werte von Zahlen und Zeitreihen als Schätzwert für die gemeinsame Dichte (oder Massenfunktion) aller Zufallsvariablen verwenden, aus denen der Prozess besteht usw.
Dilip Sarwate
2
@ DilipSarwate, Zeitreihen können stationär sein oder nicht.
Aksakal
2
@Aksakal Ich bitte zu unterscheiden. Angenommen, der Statistiker hat die Zeitreihe endlicher Länge beobachtet. es sich um eine stationäre Reihe? Woran erkennt man, dass es ist (oder nicht ist)? Sofern wir nicht mehrere Zeitreihen (zu den gleichen Zeitpunkten) zur Verfügung haben, aus denen wir Rückschlüsse auf den stochastischen Prozess ziehen können ("Gee, die Histogramme der von übernommenen Werte sind ziemlich gleich, unabhängig von der Wahl von "). . Aber eine einzelne Folge von Zahlen? Man kann nicht sagen , ob die Serie stationär ist oder nicht , aber man könnte annehmen , so re der zugrunde liegenden stochastischen Prozess ModellX n n
1,0,1,0,1,0,1
Xnn
Dilip Sarwate

Antworten:

32

Da sich in Kommentaren und Antworten viele beunruhigende Unstimmigkeiten zeigen, wenden wir uns an einige Behörden.

James Hamilton definiert nicht einmal eine Zeitreihe, aber er ist sich darüber im Klaren, was eine ist:

... diese Menge von Nummern ist nur ein mögliches Ergebnis des zugrunde liegenden stochastischen Prozesses, der die Daten generiert hat. Selbst wenn wir uns vorstellen würden, den Vorgang über einen unendlichen Zeitraum beobachtet zu haben, wäre die Folge die unendliche Folge würde immer noch als eine einzige Erkenntnis aus einem Zeitreihenprozess angesehen werden. ...{ y t } t = = { , y - 1 , y 0 , y 1 , y 2 ,T{ y t } t =

{yt}t=={,y1,y0,y1,y2,,yT,yT+1,yT+2,,},
{yt}t=

Stellen Sie sich eine Batterie von ... Computern vor, die Sequenzen erzeugen und erwägen, die mit dem Datum verbundene Beobachtung aus jedem auszuwählen Reihenfolge: Dies würde als eine Stichprobe von Realisierungen der Zufallsvariablen . ...{ y ( 1 ) t } t = - , { y ( 2 ) t } t = - , ... , { y ( I ) t } t = - I{yt(1)}t=, {yt(2)}t=,, {yt(I)}t={ y ( 1 ) t , y ( 2 ) t , , y ( I )tIYt

{yt(1),yt(2),,yt(I)}.
IYt

( Zeitreihenanalyse , Kapitel 3.)

Somit ist ein "Zeitreihenprozess" eine Menge von Zufallsvariablen die durch ganze Zahlen indiziert sind .{Yt}t

Bernt Øksendal liefert in Stochastic Differential Equations eine mathematische Standarddefinition eines allgemeinen stochastischen Prozesses:

Definition 2.1.4. Ein stochastischer Prozess ist eine parametrisierte Sammlung von Zufallsvariablen die in einem Wahrscheinlichkeitsraum und Werte in annehmen. .

{Xt}tT
(Ω,F,P) Rn

Der Parameterraum ist normalerweise (wie in diesem Buch) die halbe Linie , es kann sich aber auch um ein Intervall , die nicht negativen ganzen Zahlen und sogar Teilmengen von für .[ 0 , ) [ a , b ] R n n 1T[0,)[a,b]Rnn1

Wenn wir die beiden zusammenfassen, sehen wir, dass ein Zeitreihenprozess ein stochastischer Prozess ist, der durch ganze Zahlen indiziert wird.

Einige Leute verwenden "Zeitreihen", um sich auf die Realisierung eines Zeitreihenprozesses zu beziehen (wie im Wikipedia-Artikel ). Wir können in Hamiltons Sprache einen vernünftigen Versuch sehen, den Prozess von der Realisierung durch die Verwendung des "Zeitreihenprozesses" zu unterscheiden, so dass er "Zeitreihen" verwenden kann, um auf Realisierungen (oder sogar Daten) zu verweisen.

whuber
quelle
2
(+1) Ich halte den letzten Absatz für besonders wichtig (wenn auch subtil). Ich wollte jedoch hinzufügen, dass die Idee einer "kontinuierlichen Zeitreihe" manchmal gesehen wird. Gelegentlich wird der Ausdruck nur verwendet, um anzuzeigen, dass die Variable selbst kontinuierlich und nicht diskret ist, aber ich habe auch gesehen, dass er verwendet wird, um anzuzeigen, dass die Zeit kontinuierlich abgetastet wird , sodass "durch ganze Zahlen indiziert" möglicherweise keine allgemein akzeptierte Definition ist. Siehe z. B. hier in Time Series: Theory & Methods von Brockwell & Davis.
Silverfish
1
@ Silverfish Ich schätze diese Kommentare. Letztendlich finde ich sie jedoch aus dem einfachen Grund nicht überzeugend, dass "Reihen" in der Mathematik allgemein verwendet werden, um auf eine Funktion mit einem abzählbaren Bereich zu verweisen . "Kontinuierlich abgetastet" kann nicht in dieses Konzept einbezogen werden. Ich fordere Ihre Beobachtungen nicht heraus, dass einige Autoren stochastische Prozesse mit kontinuierlicher Zeit als "Reihen" bezeichnet haben - ich sage nur, dass sie, wenn dies der Fall ist, eine gut etablierte Terminologie missbrauchen.
Whuber
3
Ich denke, dass es in dieser Debatte einen gewissen Grad an "Beschreibung versus Verschreibung" gibt. Die Idee einer "kontinuierlichen Zeitreihe" ist definitiv eine Minderheitensprache (ich frage mich, ob dies feldabhängig ist, mein begrenztes Verständnis ist, dass sich Signalverarbeiter normalerweise auf ein "kontinuierliches Zeitsignal" und nicht auf eine "Reihe" beziehen) und ich persönlich Ich bin geneigt zuzustimmen, dass das Wort "Serie" logischerweise konsistenter mit diskreter Abtastung ist. Ich wollte nur darauf hinweisen, dass die Verwendung von Minderheiten auch unter Experten nicht ungewöhnlich ist, was für einige der erzeugten Verwirrungen verantwortlich sein kann.
Silverfish
@Silverfish, also für diese Minderheit, die auch kontinuierliche Zeitreihen betrachtet, ist stochastischer Prozess gleich Zeitreihen?
Code Papst
3

Ein stochastischer Prozess ist eine Menge oder Sammlung von Zufallsvariablen (nicht unbedingt unabhängig), wobei der Index t Werte in einer bestimmten Menge annimmt. Diese Menge ist geordnet und entspricht dem Zeitpunkt. Beispiel zufälliger Spaziergang. Zeitreihe Ist die Realisierung des stochastischen Prozesses.{Xt}

Mwandri
quelle
1

Definieren eines stochastischen Prozesses

Sei ein Wahrscheinlichkeitsraum. Sei ein weiterer messbarer Raum (zB der Raum reeller Zahlen ). Etwas ungenau gesagt:(Ω,F,P)SR

  • Eine Zufallsvariable ist eine messbare Funktion von bis .ΩS
  • Ein stochastischer Prozess ist eine Familie von Zufallsvariablen, die nach der Zeit indiziert sind . t
    • Für jeden Zeitpunkt ist eine ZufallsvariabletTXt
    • Für jedes Ergebnis ist eine Realisierung des stochastischen Prozesses, ein möglicher Weg, den mit der Zeit eingeschlagen hat.ωΩX(ω)X

Zeitreihen definieren

Während ein stochastischer Prozess eine kristallklare, mathematische Definition hat. Eine Zeitreihe ist ein weniger präziser Begriff. Mit Zeitreihen werden zwei verwandte, aber unterschiedliche Objekte bezeichnet:

  1. Wie WHuber beschreibt, ein stochastischer Prozess, der durch ganze Zahlen oder eine regelmäßige, inkrementelle Zeiteinheit indiziert wird, die gewissermaßen auf ganze Zahlen abgebildet werden kann (z. B. monatliche Daten).
  2. Eine Sammlung von Daten, die in regelmäßigen Abständen beobachtet werden. Dies könnte die Realisierung eines stochastischen Prozesses sein, der durch ganze Zahlen indiziert wird. Manchmal wird dies als Zeitreihendaten bezeichnet.

Beispiel: zwei Flips einer Wende

Sei . Sei das Ergebnis von Flip 1 bzw. 2.Ω={ωHH,ωHT,ωTH,ωTT}X1,X2

X1(ω)={1:ω{ωHH,ωHT}0:ω{ωTH,ωTT}

X2(ω)={1:ω{ωHH,ωTH}0:ω{ωHT,ωTT}

Es ist also klar, dass ein stochastischer Prozess ist. Leute können es auch eine Zeitreihe nennen, da die Indizierung durch ganze Zahlen erfolgt. Leute können auch die Verwirklichung von , z. , eine Zeitreihe oder Zeitreihendaten.X X ( ω H H ) = ( H , H ){X1,X2}XX(ωHH)=(H,H)

Matthew Gunn
quelle
0

Der Unterschied zwischen einem stochastischen Prozess und einer Zeitreihe ähnelt dem Unterschied zwischen einer Katze auf einer Tastatur und einer Antwort auf Stack Exchange: Katzen auf Tastaturen können Antworten liefern, Katzen auf Tastaturen sind jedoch keine Antworten. Darüber hinaus wird nicht jede Antwort von einer Katze auf einer Tastatur erzeugt.

Eine Zeitreihe kann als Sammlung von Zeit-Wert-Datenpunkt-Paaren verstanden werden. Ein stochastischer Prozess ist dagegen ein mathematisches Modell oder eine mathematische Beschreibung einer Verteilung von Zeitreihen¹. Einige Zeitreihen sind eine Realisierung von stochastischen Prozessen (jeder Art). Oder aus einer anderen Sicht: Ich kann einen stochastischen Prozess als Modell verwenden, um eine Zeitreihe zu generieren.

Darüber hinaus können Zeitreihen auch auf andere Weise generiert werden:

  • Sie können das Ergebnis von Beobachtungen sein und werden so von der Realität erzeugt. Während ich Realität als stochastischen Prozess modellieren kann (ich könnte auch sagen, dass ich Realität als stochastischen Prozess betrachte), ist Realität kein stochastischer Prozess in der gleichen Weise, wie das Innere einer Kiste keine Menge von Punkten ist (obwohl wir es oft tun) Betrachten Sie die beiden Äquivalente in Modellierungskontexten.

  • Sie können durch deterministische Prozesse erzeugt werden. Genau genommen könnten (und sollten) wir stochastische Prozesse und deterministische Prozesse so definieren, dass letztere Sonderfälle der ersteren sind, aber wir machen sehr selten davon Gebrauch und sprechen von deterministischen Prozessen als Sonderfällen stochastischer Prozesse kann Verwirrung stiften - Sie könnten es damit vergleichen, dass Sie ein System nichtlinearer Gleichungen bezeichnen.x=2


¹ Wenn es sich um einen zeitdiskreten stochastischen Prozess handelt. Kontinuierlicher stochastischer Prozess sind eher Funktionsverteilungen als Zeitreihen.

Wrzlprmft
quelle
1
Es ist unklar, ob Sie zwischen einem Modell und einem Datensatz unterscheiden oder ob Sie versuchen, einen anderen Punkt hervorzuheben. Es ist auch unklar, was Sie für einen stochastischen Prozess halten. (Alles, was Sie gesagt haben, ist, dass es "nicht einmal" ein "zeitdiskreter stochastischer Prozess" ist.) Diese Unsicherheiten in Ihrer Darstellung könnten die Verwirrung verstärken, anstatt sie aufzulösen.
Whuber
@whuber: Ich habe meine Antwort bearbeitet, um einige Aspekte zu verdeutlichen, aber ich denke, Sie haben auch einige der "nicht einmal" -Sätze falsch verstanden.
Wrzlprmft
0

Ich freue mich über alle Beiträge / Kommentare zum Thema Zeitreihen vs. stochastischer Prozess. Hier ist mein Verständnis des Unterschieds: Zeitreihen sind beobachtete Phänomene, die als eine Reihe von Zahlen aufgezeichnet werden, die mit der Zeit bei der Beobachtung indiziert sind; Es handelt sich höchstwahrscheinlich um eine Reihe von Beobachtungen eines realen Phänomens wie der Aktienkurse an der New Yorker Börse. Andererseits wird unter stochastischem Prozess wie immer eine mathematische Darstellung (keine Produktion) der Zeitreihe verstanden.

Magus
quelle
Stochastische Prozesse sind allgemeiner als Zeitreihen. Zum Beispiel sind Markov-Ketten stochastische Prozesse, die keine Zeitreihen sind.
Michael R. Chernick
1
@Michael Chernick: Stimmt Markov Chain nicht mit den Definitionen überein: "Eine Menge von Zufallsvariablen, die durch ganze Zahlen indiziert werden" und "Ein stochastischer Prozess, der durch ganze Zahlen indiziert wird"? Welche Teile dieser Definitionen erfüllen Markov-Ketten nicht oder sind Sie mit diesen Definitionen nicht einverstanden?
ColorStatistics