In welcher Beziehung steht ARMA / ARIMA zur Modellierung gemischter Effekte?

14

Bei der Paneldatenanalyse habe ich mehrstufige Modelle mit zufälligen / gemischten Effekten verwendet, um mit Autokorrelationsproblemen umzugehen (dh Beobachtungen werden im Laufe der Zeit in Gruppen zusammengefasst), wobei andere Parameter hinzugefügt wurden, um bestimmte Zeitangaben und Schocks von Interesse zu berücksichtigen . ARMA / ARIMA scheint darauf ausgelegt zu sein, ähnliche Probleme anzugehen.

Die Ressourcen, die ich online gefunden habe, behandeln entweder Zeitreihen (ARMA / ARIMA) oder gemischte Effektmodelle, aber abgesehen davon, dass ich auf Regression aufbaue, verstehe ich die Beziehung zwischen den beiden nicht. Möchte man ARMA / ARIMA in einem Mehrebenenmodell verwenden? Gibt es einen Sinn, in dem die beiden gleichwertig oder überflüssig sind?

Antworten oder Verweise auf Ressourcen, die dies diskutieren, wären großartig.

Benjamin Mako Hill
quelle

Antworten:

11

Ich denke, der einfachste Weg, dies zu betrachten, besteht darin, zu beachten, dass ARMA und ähnliche Modelle andere Funktionen als Mehrebenenmodelle haben und unterschiedliche Daten verwenden.

Bei der Zeitreihenanalyse handelt es sich normalerweise um lange Zeitreihen (möglicherweise mit Hunderten oder sogar Tausenden von Zeitpunkten). Das primäre Ziel besteht darin, zu untersuchen, wie sich eine einzelne Variable im Laufe der Zeit ändert. Es gibt ausgefeilte Methoden, um mit vielen Problemen umzugehen - nicht nur mit Autokorrelation, sondern auch mit Saisonalität und anderen periodischen Änderungen und so weiter.

Mehrstufige Modelle sind Erweiterungen aus der Regression. Sie haben normalerweise relativ wenige Zeitpunkte (obwohl sie viele haben können) und das primäre Ziel ist es, die Beziehung zwischen einer abhängigen Variablen und mehreren unabhängigen Variablen zu untersuchen. Diese Modelle sind nicht so gut im Umgang mit komplexen Beziehungen zwischen einer Variablen und der Zeit, zum Teil, weil sie normalerweise weniger Zeitpunkte haben (es ist schwierig, die Saisonalität zu betrachten, wenn Sie nicht für jede Saison mehrere Daten haben).

Peter Flom - Wiedereinsetzung von Monica
quelle
1
: Peter Sehr schöne Zusammenfassung. Ich möchte nur hinzufügen, dass Zeitreihendaten normalerweise nicht "lang" sind, wenn es um wöchentliche / monatliche / jährliche Daten geht, ABER wenn es um tägliche / stündliche / sekündliche Daten geht, kann es lang werden.
IrishStat
3
Ihre Erklärung ist in der Praxis ziemlich gut, obwohl ich eine kleine Einschränkung hinzufügen möchte. ARIMA-Modelle können als State Space- arimaModelle (Rs tun dies unter der Haube), auch als Dynamic Linear-Modelle (DLMs) bezeichnet, implementiert werden. DLMs sind auch Erweiterungen aus der Regression (anders als Mixed Effects), daher würde ich vermuten, dass es eine tiefe Beziehung zwischen ARIMA- und Mixed-Effect-Modellen gibt. Das ändert nichts an den Unterschieden in der Praxis , die Sie gut zusammenfassen.
Wayne
1
Das ist sehr nützlich. Ich möchte darauf hinweisen, dass das Hinzufügen eines gleitenden Durchschnitts zu einem Mehrebenenmodell durchaus möglich ist (und in der einfachsten Form immer durch das Hinzufügen verzögerter Variablen (z. B. der abhängigen Variablen at) erfolgtt-1).
Benjamin Mako Hill
Benjamin: Die ganze Idee der Statistik ist es, STRUKTUR ZU IDENTIFIZIEREN, nicht davon auszugehen.
IrishStat
Ich denke, eine vollständige Antwort könnte auch den Unterschied zwischen Zeitreihen und Paneldaten erwähnen. Wenn ich das richtig verstehe, werden ARIMA und ähnliche Daten hauptsächlich für Daten verwendet, bei denen jede Beobachtung im Zeitverlauf dieselbe Variable aufweist. Im Mehrebenenmodell für Veränderungen konzentrieren wir uns normalerweise auf Paneldaten und modellieren eine Variable, die über eine Reihe von Personen, Gruppen, Ländern usw. im Laufe der Zeit gemessen wird. Richtig?
Benjamin Mako Hill
7

ARMA / ARIMA sind univariate Modelle, die optimieren, wie die Vergangenheit einer einzelnen Serie verwendet wird, um diese einzelne Serie vorherzusagen. Man kann diese Modelle mit empirisch identifizierten Interventionsvariablen wie Impulsen, Pegelverschiebungen, saisonalen Impulsen und lokalen Zeittrends ergänzen, aber sie sind grundsätzlich nicht kausal, da keine vom Benutzer vorgeschlagenen Eingabeserien vorhanden sind. Die multivariate Erweiterung dieser Modelle lautet XARMAX oder allgemeiner Transfer Function Models, die PDL / ADL-Strukturen für die Eingänge verwenden und für den Rest die erforderliche ARMA / ARIMA-Struktur verwenden. Diese Modelle können auch durch Einbeziehen empirisch identifizierbarer deterministischer Eingaben stabilisiert werden. Somit können beide Modelle als Anwendungen für Längsschnittdaten (wiederholte Messungen) betrachtet werden. Jetzt die Wikipedia-Artikel zu mehrstufigen Modellen bezieht sich auf ihre Anwendung auf Zeitreihen- / Längsschnittdaten unter der Annahme bestimmter primitiver / trivialer, dh nicht analytischer Strukturen wie "Die einfachsten Modelle gehen davon aus, dass der Zeiteffekt linear ist. Polynommodelle können angegeben werden, um quadratische oder kubische Zeiteffekte zu berücksichtigen." .

Das Übertragungsfunktionsmodell kann auf mehrere Gruppen ausgedehnt werden, so dass sich eine Analyse der gepoolten Querschnittszeitreihen ergibt, bei der die entsprechende Struktur (Verzögerungen / Ableitungen) in Verbindung mit der ARIMA-Struktur verwendet werden kann, um sowohl lokale Modelle als auch ein Gesamtmodell zu bilden.

IrishStat
quelle
Mehrebenenmodelle können auch eine allgemeine Zeitspezifikation verwenden, die für jede Zeit Dummys hinzufügt, die den durchschnittlichen Effekt für diesen Zeitraum erfassen.
Benjamin Mako Hill
1
: Benjamin Das Problem bei rhat ist, dass Sie davon ausgehen, dass die Saisonalität deterministisch ist und dass die saisonalen Koeffizienten im Vergleich zu einem saisonalen Puls einer der ISI-1-Dummies, die zum ersten k-Mal keine Wirkung hatten, über die Zeit unveränderlich sind Perioden aber tat dies nach. Eine andere, ebenfalls mögliche saisonale Struktur ist die saisonale ARIMA-Komponente, die eine adaptive Reaktion auf frühere Saisons im Vergleich zu Ihrer vorgeschlagenen FIXED-Reaktion verwendet.
IrishStat