Nachdem ich bisher hauptsächlich mit Querschnittsdaten gearbeitet habe und erst kürzlich beim Durchsuchen gestolpert bin und durch eine Reihe einführender Zeitreihenliteratur gestolpert bin, frage ich mich, welche Rolle erklärende Variablen bei der Zeitreihenanalyse spielen.
Ich möchte einen Trend erklären, anstatt den Trend zu verringern. Das meiste, was ich als Einführung gelesen habe, geht davon aus, dass die Serie aus einem stochastischen Prozess stammt. Ich habe über AR (p) - und MA-Prozesse sowie über die ARIMA-Modellierung gelesen. Da ich mehr Informationen als nur autoregressive Prozesse verarbeiten wollte, fand ich VAR / VECM und führte einige Beispiele aus, aber ich frage mich immer noch, ob es einen Fall gibt, der näher mit dem zusammenhängt, was Erklärungen in Querschnitten tun.
Die Motivation dahinter ist, dass die Zerlegung meiner Serie zeigt, dass der Trend den Hauptbeitrag leistet, während der Rest und der saisonale Effekt kaum eine Rolle spielen. Ich möchte diesen Trend erklären.
Kann / sollte ich meine Serie auf mehrere verschiedene Serien zurückführen? Intuitiv würde ich wegen der seriellen Korrelation gls verwenden (ich bin mir über die Cor-Struktur nicht so sicher). Ich habe von falscher Regression gehört und verstehe, dass dies eine Falle ist, aber ich suche nach einer Möglichkeit, einen Trend zu erklären.
Ist das völlig falsch oder ungewöhnlich? Oder habe ich bisher nur das richtige Kapitel verpasst?
quelle
Die gleiche Intuition wie bei der Querschnittsregression kann bei der Zeitreihenregression verwendet werden. Es ist durchaus sinnvoll zu versuchen, den Trend mit anderen Variablen zu erklären. Der Hauptunterschied besteht darin, dass implizit angenommen wird, dass die Regressoren Zufallsvariablen sind. Also im Regressionsmodell:
wir benötigen anstelle von und anstelle von .E ε t = 0 E ( ε 2 t | X t 1 , . . . , X t k ) = σ 2 E ε 2 t = σ 2E(εt|Xt1,...,Xtk)=0 Eεt=0 E(ε2t|Xt1,...,Xtk)=σ2 Eε2t=σ2
Der praktische Teil der Regression bleibt gleich, es gelten alle üblichen Statistiken und Methoden.
Der schwierige Teil ist zu zeigen, für welche Arten von Zufallsvariablen oder in diesen Fällen stochastische Prozesse wir klassische Methoden verwenden können. Der übliche zentrale Grenzwertsatz kann nicht angewendet werden, da er unabhängige Zufallsvariablen beinhaltet. Zeitreihenprozesse sind normalerweise nicht unabhängig. Hier kommt die Bedeutung der Stationarität ins Spiel. Es wird gezeigt, dass für einen großen Teil der stationären Prozesse der zentrale Grenzwertsatz angewendet werden kann, sodass die klassische Regressionsanalyse angewendet werden kann.Xtk
Die wichtigste Einschränkung der Zeitreihenregression besteht darin, dass sie massiv versagen kann, wenn die Regressoren nicht stationär sind. Dann können übliche Regressionsmethoden zeigen, dass der Trend erklärt wird, obwohl dies nicht der Fall ist. Wenn Sie also den Trend erklären möchten, müssen Sie prüfen, ob er nicht stationär ist, bevor Sie fortfahren. Andernfalls könnten Sie zu falschen Schlussfolgerungen gelangen.
quelle
Wenn Sie unterstützende / kausale / helfende / rechte / exogene / Prädiktor-Reihen haben, ist der bevorzugte Ansatz die Erstellung einer Übertragungsfunktion mit einer einzigen Gleichung und mehreren Eingaben. Man muss mögliche Modellreste sowohl für nicht spezifizierte / ausgelassene deterministische Eingaben untersuchen, dh für die Interventionserkennung ala Ruey Tsay 1988 Journal of Forecasting als auch für nicht spezifizierte stochastische Eingaben über eine ARIMA-Komponente. Somit können Sie nicht nur die vom Benutzer vorgeschlagenen Kausale (und alle erforderlichen Verzögerungen!) Explizit einbeziehen, sondern auch zwei Arten von ausgelassenen Strukturen (Dummies und ARIMA).
Es sollte darauf geachtet werden, dass sich die Parameter des endgültigen Modells im Laufe der Zeit nicht wesentlich ändern, da sonst die Datensegmentierung möglicherweise in Ordnung ist und nicht nachgewiesen werden kann, dass die Residuen des endgültigen Modells eine heterogene Varianz aufweisen.
Der Trend in der ursprünglichen Reihe kann auf Trends in der Prädiktorserie oder auf autoregressive Dynamik in der interessierenden Reihe oder möglicherweise auf eine ausgelassene deterministische Reihe zurückzuführen sein, die durch eine stationäre Konstante oder sogar einen oder mehrere lokale Zeittrends ersetzt wird.
quelle
Aus weniger technischer Sicht ist es oft nicht sehr hilfreich, nur den Trend zu erklären. das heißt, die Zeit als Prädiktor von primärem Interesse zu behandeln. Die Variation einer Reihe über die Zeit impliziert häufig die zugrunde liegenden Effekte anderer Variablen, einschließlich autoregressiver und / oder exogener Prozesse, was für die Untersuchung konzeptionell relevanter ist. Daraus folgt, dass, wenn diese Variablen auch über die Zeit variieren, die Kontrolle des Zeiteffekts tatsächlich erforderlich ist, um nicht in die künstlich signifikante Beziehung zu fallen, wie @mpiktas gezeigt hat.
quelle