Wann ist es angebracht, Modelle durch Minimierung des AIC auszuwählen?

11

Zumindest unter Statistikern höheren Kalibers ist es allgemein bekannt, dass Modelle mit Werten der AIC-Statistik innerhalb eines bestimmten Schwellenwerts des Mindestwerts als angemessen angesehen werden sollten wie das Modell zur Minimierung der AIC-Statistik. Zum Beispiel finden wir in [1, S.221]

Dann wären Modelle mit kleinem GCV oder AIC am besten geeignet. Natürlich sollte man GCV oder AIC nicht einfach blind minimieren. Vielmehr sollten alle Modelle mit relativ kleinen GCV- oder AIC-Werten als potenziell angemessen angesehen und nach ihrer Einfachheit und wissenschaftlichen Relevanz bewertet werden.

In ähnlicher Weise haben wir in [2, S.144]

Es wurde vorgeschlagen (Duong, 1984), Modelle mit AIC-Werten innerhalb von c des Mindestwerts als wettbewerbsfähig zu betrachten (mit c = 2 als typischem Wert). Die Auswahl aus den Wettbewerbsmodellen kann dann auf Faktoren wie dem Weißgrad der Residuen (Abschnitt 5.3) und der Einfachheit des Modells basieren.

Verweise:

  1. Ruppert, D.; Wand, MP & Carrol, RJ Semiparametric Regression , Cambridge University Press, 2003
  2. Brockwell, PJ & Davis, RA Einführung in Zeitreihen und Prognosen , John Wiley & Sons, 1996

Welches der beiden folgenden Modelle sollte angesichts der obigen Ausführungen bevorzugt werden?

print( lh300 <- arima(lh, order=c(3,0,0)) )
# ... sigma^2 estimated as 0.1787:  log likelihood = -27.09,  aic = 64.18
print( lh100 <- arima(lh, order=c(1,0,0)) )
# ... sigma^2 estimated as 0.1975:  log likelihood = -29.38,  aic = 64.76

Wann ist es allgemein angemessen, Modelle auszuwählen, indem der AIC oder die zugehörige Statistik blind minimiert werden?

Winterschlaf
quelle
Sie haben den AIC für keines der Modelle angegeben.
Peter Flom - Monica wieder einsetzen
Ich habe gezeigt, wie man es mit R. bekommt
Winterschlaf
1
+1 Probleme in den unten angegebenen ARIMA-Modellen. Ansonsten: "Vereinfachung eines Prognosemodells: eine auf klinischen Daten basierende Simulationsstudie." Ambler 2002 ist die am häufigsten zitierte Referenz dazu.
Charles

Antworten:

3

Wenn Sie aus Cosma Shalizis Vorlesungsskripten über die Wahrheit über lineare Regression umschreiben , sollten Sie niemals ein Modell wählen, nur weil es zufällig eine Statistik wie AIC minimiert hat , z

Every time someone solely uses an AIC statistic for model selection, an angel loses its
wings. Every time someone thoughtlessly minimises it, an angel not only loses its wings,
but is cast out of Heaven and falls in most extreme agony into the everlasting fire.
Skulker
quelle
1
Wie ein berühmter Jude sagte: "Vorstellungskraft ist besser als Wissen" :)
Winterschlaf
Und wie ein berühmter Nichtjude sagte "Man kann viel sehen, wenn man hinschaut" (Yogi Berra).
Peter Flom - Monica wieder einsetzen
Und was wir sehen, hängt natürlich hauptsächlich davon ab, wonach wir suchen. - John Lubbock
Winterschlaf
12

Ich würde sagen, dass es oft angemessen ist, AIC bei der Modellauswahl zu verwenden, aber selten richtig, es als alleinige Grundlage für die Modellauswahl zu verwenden. Wir müssen auch fundiertes Wissen verwenden.

In Ihrem speziellen Fall vergleichen Sie ein Modell mit einem AR 3. Ordnung mit einem Modell mit einem AR 1. Ordnung. Zusätzlich zu AIC (oder etwas Ähnlichem) würde ich mir die Autokorrelations- und partiellen Autokorrelationsdiagramme ansehen. Ich würde auch überlegen, was ein Modell 3. Ordnung bedeuten würde . Macht das Sinn? Fügt es dem materiellen Wissen hinzu? (Oder hilft es bei der Vorhersage, wenn Sie ausschließlich an Vorhersagen interessiert sind?)

Im Allgemeinen ist es manchmal interessant, eine sehr kleine Effektgröße zu finden.

Peter Flom - Monica wieder einsetzen
quelle
Haben Sie gerade gesagt, dass ein guter Algorithmus zur Auswahl eines Arima-Modells nicht ausschließlich auf dem AIC-Kriterium (oder einem ähnlichen Kriterium) basieren sollte?
Winterschlaf
Ja, das habe ich gesagt.
Peter Flom - Monica wieder einsetzen
Und an diesem Ende hörte ich es als Auf Wiedersehen auto.arima. Ich würde es vorziehen, einem Ansatz zu folgen, der in Kapitel 6 von Bisgaard, S. & Kulahci, M., beschrieben ist. Zeitreihenanalyse und -prognose anhand eines Beispiels von John Wiley & Sons, Inc., 2011, noch genauer in Abschnitt 6.5 DIE UNTERSCHIEDE IN DEN MODELLEN
Winterschlaf
1
@Hibernating: Die Autoren auto.arima, Hyndman & Khandakar (2008) , sagen: -. „Automatische Prognosen von einer großen Anzahl von univariaten Zeitreihen werden häufig in Unternehmen benötigt Es ist üblich , monatlich zu haben über tausend Produktlinien , die Notwendigkeit Prognose zumindest. Selbst wenn eine geringere Anzahl von Prognosen erforderlich ist, ist möglicherweise niemand in der Verwendung von Zeitreihenmodellen für deren Erstellung entsprechend geschult. Unter diesen Umständen ist ein automatischer Prognosealgorithmus ein wesentliches Werkzeug. " Beachten Sie diese Umstände .
Scortchi - Monica wieder einsetzen
2
Danke, aber das hatte ich schon mal gelesen. Selbst wenn wir die offensichtlichen Probleme mit dem "Auto" -Teil vorerst ignorieren, gibt es Probleme mit dem "Arima" -Teil, insbesondere wenn es um saisonale Modelle erweitert wird. Saisonale ARIMA-Modelle wurden von PJ Harrison, C Chatfield und einigen anderen Persönlichkeiten, von denen ich zufällig gelernt habe, stark kritisiert. Ich habe nichts gegen automatische Prognosen, wenn es i) absolut notwendig ist und ii) basierend auf Algorithmen, die ich finden kann - ansonsten folge ich DR Cox 'Rat in seinem Kommentar zu Leo Breimans "Zwei Kulturen" -Papier in Stat Science vor einigen Jahren.
Winterschlaf
8

PP

Frank Harrell
quelle
2
Dein letzter Satz ist interessant. Ich erinnere mich, dass ich gelesen habe, dass das Hinzufügen selbst unbedeutender Prädiktoren zur Regression durchaus gerechtfertigt sein kann, wenn der endgültige Zweck die Vorhersage ist. Ich habe damals nicht viel darauf geachtet, aber jetzt werde ich versuchen, diese Referenz zu finden.
Winterschlaf
3
Anstatt hinzuzufügen, würde ich sagen, vermeiden Sie das Entfernen . Und es ist nicht nur eine Vorhersage, sondern die Verwendung statistischer Assoziationsbewertungen als Leitfaden für die Variablenauswahl führt zu Verzerrungen und ungültigen Standardfehlern und Konfidenzgrenzen.
Frank Harrell