Ich habe eine Weile mit der Stationarität in meinem Kopf gerungen ... Denkst du so darüber nach? Alle Kommentare oder weitere Gedanken werden geschätzt.
Bei stationären Prozessen werden Zeitreihenwerte so generiert, dass das Verteilungsmittel und die Varianz konstant bleiben. Genau genommen ist dies als schwache Form der Stationarität oder Kovarianz / mittlere Stationarität bekannt.
Eine schwache Form der Stationarität liegt vor, wenn die Zeitreihe über die Zeit hinweg einen konstanten Mittelwert und eine konstante Varianz aufweist.
Vereinfacht gesagt, sagen die Praktiker, dass die stationären Zeitreihen keine Trends aufweisen - sie schwanken um den konstanten Mittelwert und haben konstante Varianz.
Die Kovarianz zwischen verschiedenen Verzögerungen ist konstant und hängt nicht von der absoluten Position in Zeitreihen ab. Beispielsweise sollte die Kovarianz zwischen t und t-1 (Verzögerung erster Ordnung) immer gleich sein (für den Zeitraum von 1960 bis 1970 genauso wie für den Zeitraum von 1965 bis 1975 oder für jeden anderen Zeitraum).
In instationären Prozessen gibt es keinen langfristigen Mittelwert, auf den die Serie zurückgreift. Wir sagen also, dass instationäre Zeitreihen nicht Rückgängigmachen bedeuten. In diesem Fall hängt die Varianz von der absoluten Position in der Zeitreihe ab und die Varianz wird im Laufe der Zeit unendlich. Technisch gesehen gehen Autokorrelationen nicht mit der Zeit verloren, aber in kleinen Stichproben verschwinden sie - wenn auch langsam.
In stationären Prozessen sind Stöße vorübergehend und lösen sich mit der Zeit auf (verlieren Energie). Nach einer Weile tragen sie nicht zu den neuen Zeitreihenwerten bei. Zum Beispiel hatte etwas, was vor langer Zeit passierte, wie der Zweite Weltkrieg, einen Einfluss, aber wenn die Zeitreihe heute dieselbe ist, als wäre der Zweite Weltkrieg nie passiert, würden wir sagen, dass der Schock seine Energie verloren hat oder zerstreut. Stationarität ist besonders wichtig, da viele klassische ökonometrische Theorien unter der Annahme der Stationarität abgeleitet werden.
Eine starke Form der Stationarität liegt vor, wenn die Verteilung einer Zeitreihe genau dieselbe Zeitspanne aufweist. Mit anderen Worten, die Verteilung der ursprünglichen Zeitreihen entspricht genau der Verteilung der verzögerten Zeitreihen (um eine beliebige Anzahl von Verzögerungen) oder sogar der Untersegmente der Zeitreihen. Beispielsweise deutet eine starke Form auch darauf hin, dass die Verteilung auch für die Teilsegmente 1950-1960, 1960-1970 oder sogar überlappende Zeiträume wie 1950-1960 und 1950-1980 gleich sein sollte. Diese Form der Stationarität wird als stark bezeichnet, da sie keine Verteilung annimmt. Es heißt nur, dass die Wahrscheinlichkeitsverteilung gleich sein sollte. Bei schwacher Stationarität haben wir die Verteilung durch Mittelwert und Varianz definiert. Wir könnten diese Vereinfachung tun, weil wir implizit die Normalverteilung angenommen haben, und die Normalverteilung ist vollständig durch ihren Mittelwert und ihre Varianz oder Standardabweichung definiert. Dies ist nichts anderes als zu sagen, dass das Wahrscheinlichkeitsmaß der Sequenz (innerhalb der Zeitreihe) dasselbe ist wie das für die verzögerte / verschobene Sequenz von Werten innerhalb derselben Zeitreihe.
quelle
Antworten:
Zunächst ist zu beachten, dass Stationarität eine Eigenschaft eines Prozesses und nicht einer Zeitreihe ist. Sie betrachten das Ensemble aller durch einen Prozess erzeugten Zeitreihen. Wenn die statistischen Eigenschaften¹ dieses Ensembles (Mittelwert, Varianz, ...) über die Zeit konstant sind, spricht man von einem stationären Prozess . Streng genommen ist es unmöglich zu sagen, ob eine bestimmte Zeitreihe durch einen stationären Prozess erzeugt wurde (jedoch können wir mit einigen Annahmen eine gute Vermutung anstellen).
Intuitiver bedeutet Stationarität, dass es für Ihren Prozess keine bestimmten Zeitpunkte gibt (die die statistischen Eigenschaften Ihrer Beobachtung beeinflussen). Ob dies für einen bestimmten Prozess gilt, hängt entscheidend davon ab, was Sie als fest oder variabel für Ihren Prozess betrachten, dh was in Ihrem Ensemble enthalten ist.
Eine typische Ursache für Nichtstationarität sind zeitabhängige Parameter, mit denen Zeitpunkte anhand der Parameterwerte unterschieden werden können. Ein weiterer Grund sind feste Anfangsbedingungen.
Betrachten Sie die folgenden Beispiele:
Der Lärm, der von einem einzelnen Auto, das zu einem bestimmten Zeitpunkt vorbeifährt, zu meinem Haus gelangt , ist kein stationärer Prozess. ZB ist die durchschnittliche Amplitude² am höchsten, wenn sich das Auto direkt neben meinem Haus befindet.
Der Lärm, der durch den Straßenverkehr in mein Haus gelangt, ist im Allgemeinen ein stationärer Prozess, wenn wir die Zeitabhängigkeit der Verkehrsintensität ignorieren (z. B. weniger Verkehr nachts oder an Wochenenden). Es gibt keine besonderen Zeitpunkte mehr. Während es starke Schwankungen einzelner Zeitreihen geben kann, verschwinden diese, wenn ich das Ensemble aller Realisierungen des Prozesses betrachte.
Wenn wir bekannte Auswirkungen auf die Verkehrsintensität berücksichtigen, z. B. dass nachts weniger Verkehr herrscht, ist der Prozess wieder instationär: Die durchschnittliche Amplitude² variiert mit einem Tagesrhythmus. Jeder Zeitpunkt wird durch die Tageszeit unterschieden.
Die Position eines einzelnen Pfefferkorns in einem Topf mit kochendem Wasser ist ein stationärer Vorgang (ohne Berücksichtigung des Wasserverlusts durch Verdunstung). Es gibt keine besonderen Zeitpunkte.
¹ Aus praktischen Gründen wird dies manchmal auf den Mittelwert und die Varianz (schwache Stationarität) reduziert, aber ich halte dies nicht für hilfreich, um das Konzept zu verstehen. Ignorieren Sie einfach die schwache Stationarität, bis Sie die Stationarität verstanden haben.
² Dies ist der Mittelwert der Lautstärke, aber die Standardabweichung des tatsächlichen Tonsignals (machen Sie sich hier keine allzu großen Sorgen).
quelle
Der Klarheit halber möchte ich hinzufügen, dass jede Zeitreihe, in der die Datenpunkte normal über die Zeit mit einem konstanten Mittelwert verteilt sind und die Varianz als starke stationäre Zeitreihe gilt, da die Normalverteilung bei gegebenem Mittelwert und Standardabweichung immer dieselbe Wahrscheinlichkeitsverteilungskurve hat ( Die Eingaben in die Normalgleichung hängen nur vom Mittelwert und der Standardabweichung ab.
Dies ist beispielsweise bei einer t-Verteilung nicht der Fall, bei der eine Eingabe in die t-Verteilungsgleichung Gamma ist, die die Form der Verteilungskurve trotz eines konstanten Mittelwerts und einer konstanten Standardabweichung beeinflusst.
quelle