Regression mit unterschiedlicher Frequenz

10

Ich versuche, eine einfache Regression durchzuführen, aber meine Y-Variablen werden monatlich und x-Variablen jährlich beobachtet. Ich werde einige Anleitungen zu einem geeigneten Ansatz, der für Regressionen mit unterschiedlichen Frequenzen verwendet werden kann, sehr schätzen.

Vielen Dank

magnaJ
quelle
Wenn Sie sich die Beziehung als kausal vorstellen, kann es sich lohnen, darüber nachzudenken, wie genau Sie das X sehen, das zum Y führt - dann wird häufig eine mögliche Strategie klarer. Wie führt Ihre jährliche Sache zu einem Ergebnis Ihrer monatlichen Sache? Ist X ein Proxy für etwas anderes oder hängt Y wirklich von Annual-X ab?
Glen_b -Reinstate Monica

Antworten:

6

Es folgen drei Möglichkeiten. Je nach Situation könnte jeder geeignet sein.

  1. Zeitaggregation oder Disaggregation.

Dies ist möglicherweise der einfachste Ansatz, bei dem Sie die Hochfrequenzdaten (monatlich) in Jahresdaten konvertieren, indem Sie beispielsweise Summen, Durchschnittswerte oder Werte für das Ende des Zeitraums verwenden. Die niederfrequenten (jährlichen) Daten könnten natürlich unter Verwendung einer Interpolationstechnik in monatliche Daten umgewandelt werden. Zum Beispiel mit dem Chow-Lin-Verfahren. Es kann nützlich sein, sich hierzu auf das tempdisaggPaket zu beziehen : http://cran.r-project.org/web/packages/tempdisagg/index.html .

  1. Mi (xed) da (ta) s (Verstärkung) (MIDAS).

Eine zweite Option sind Midas-Regressionen, die von Eric Ghysels populär gemacht wurden. Hier gibt es zwei Hauptideen. Der erste ist die Frequenzausrichtung. Die zweite besteht darin, den Fluch der Dimensionalität durch Angabe eines geeigneten Polynoms zu bekämpfen. Das uneingeschränkte MIDAS-Modell ist das einfachste innerhalb der Modellklasse und kann durch gewöhnliche kleinste Quadrate geschätzt werden. Weitere Details und die Implementierung dieser Modelle bei der RVerwendung des midasrPakets finden Sie hier: http://mpiktas.github.io/midasr/ . Weitere MATLABInformationen finden Sie auf der Seite von Ghysels: http://www.unc.edu/~eghysels/ .

  1. Kalman-Filtermethoden.

Dies ist ein Ansatz zur Modellierung des Zustandsraums, bei dem die Niederfrequenzdaten als NAs enthaltend behandelt und mithilfe eines Kalman-Filters ausgefüllt werden. Dies ist meine persönliche Präferenz, aber es hat die Schwierigkeit, das richtige Zustandsraummodell anzugeben.

Weitere Informationen zu den Vor- und Nachteilen dieser Methoden finden Sie in State Space Models und MIDAS Regressions von Jennie Bai, Eric Ghysels und Jonathan H. Wright (2013).

Graeme Walsh
quelle
Es gibt auch einige MiDAS-Implementierungen in Python: github.com/mikemull/midaspy
Rafael Valero