Aus Wikipedia gibt es eine Definition von Akaikes Informationskriterium (AIC) als , wobei die Anzahl der Parameter und die log-Wahrscheinlichkeit des Modells ist.
Unsere Ökonometrie stellt jedoch an einer angesehenen Universität fest, dass . Hier ist die geschätzte Varianz für die Fehler in einem ARMA-Modell und die Anzahl der Beobachtungen im Zeitreihendatensatz.
Ist die letztere Definition gleichbedeutend mit der ersten, aber einfach auf ARMA-Modelle abgestimmt? Oder gibt es einen Konflikt zwischen den beiden Definitionen?
Antworten:
Die Formel, die Sie aus Ihren Notizen zitieren, ist nicht genau AIC.
AIC ist .−2logL+2k
Hier werde ich eine ungefähre Ableitung skizzieren, die klar genug macht, was los ist.
Wenn Sie ein Modell mit unabhängigen normalen Fehlern mit konstanter Varianz haben,
die unter maximaler Wahrscheinlichkeit geschätzt werden kann als
(Unter der Annahme, dass die Schätzung von die ML-Schätzung ist)σ2
So (bis durch eine Konstante zu verschieben)- 2 logL +2k=nlogσ^2+ 2 k
Wenn nun im ARMA-Modell im Vergleich zu p und q wirklich groß ist, kann die Wahrscheinlichkeit durch ein solches Gauß-Gerüst angenähert werden (z. B. können Sie den ARMA ungefähr als einen längeren AR und eine Bedingung mit genügend Bedingungen schreiben, um diesen AR zu schreiben als Regressionsmodell), also mit T anstelle von n :T p q T n
daher
Wenn Sie nun einfach AICs vergleichen , spielt diese Division durch keine Rolle, da sie die Reihenfolge der AIC-Werte nicht ändert.T
Wenn Sie AIC jedoch für einen anderen Zweck verwenden, der sich auf den tatsächlichen Wert der Unterschiede in AIC stützt (z. B. für die von Burnham und Anderson beschriebene Multimodell-Inferenz), ist dies von Bedeutung.
Zahlreiche ökonometrische Texte scheinen diese AIC / T-Form zu verwenden. Seltsamerweise scheinen einige Bücher auf Hurvich und Tsai 1989 oder Findley 1985 für diese Form Bezug zu nehmen, aber Hurvich & Tsai und Findley scheinen die ursprüngliche Form zu diskutieren (obwohl ich nur einen indirekten Hinweis darauf habe, was Findley gerade tut, also gibt es vielleicht einen etwas in Findley drauf).
Eine solche Skalierung kann aus einer Vielzahl von Gründen erfolgen - zum Beispiel können Zeitreihen, insbesondere Hochfrequenz-Zeitreihen, sehr lang sein und gewöhnliche AICs können dazu neigen, unhandlich zu werden, insbesondere wenn sehr klein ist. (Es gibt einige andere mögliche Gründe, aber da ich den Grund dafür wirklich nicht kenne, gehe ich nicht alle möglichen Gründe durch.)σ2
Vielleicht möchten Sie sich Rob Hyndmans Liste der Fakten und Irrtümer des AIC ansehen , insbesondere die Punkte 3 bis 7. Einige dieser Punkte könnten dazu führen, dass Sie zumindest ein wenig vorsichtig sind, wenn Sie sich zu stark auf die Annäherung nach der Gaußschen Wahrscheinlichkeit verlassen, aber Vielleicht gibt es eine bessere Rechtfertigung, als ich hier anbiete.
Ich bin mir nicht sicher, ob es einen guten Grund gibt, diese Annäherung an die Log-Wahrscheinlichkeit anstelle des tatsächlichen AIC zu verwenden, da heutzutage viele Zeitreihenpakete dazu neigen, die tatsächliche Log-Wahrscheinlichkeit für ARMA-Modelle zu berechnen (/ maximieren). Es scheint wenig Grund zu geben, es nicht zu benutzen.
quelle
Ich glaube, dass dies auf der Annahme normaler Fehler beruht. In der Ökonometrie arbeiten Sie mit Asymptotik, insbesondere in Zeitreihenanwendungen mit AIC. Folglich sollte die normale Annahme asymptotisch gelten, um dieses (asymptotische) Modellauswahlschema zu rechtfertigen.
quelle