Angesichts der jüngsten Änderung der Standardmodellauswahlstatistik im Prognosepaket des R von AIC auf AICc bin ich gespannt, ob letzteres tatsächlich überall anwendbar ist. Ich habe diesbezüglich eine Reihe von Fragen, und hier ist die erste.
Ich weiß, dass das bekannte Buch in (1) von Burnham und Anderson (Nicht-Statistiker), wie hier zusammengefasst , empfiehlt , AIC überall durch AICc zu ersetzen . Auf das Buch wird von jüngeren Statistikern manchmal unkritisch Bezug genommen, siehe z. B. Kommentare zu diesem Blog-Beitrag von Rob Hyndman , aber der Statistiker Brian Ripley riet auf radikal andere Weise:
“Burnham and Anderson (2002) is a book I would recommend people NOT read until
they have read the primary literature. I see no evidence that the authors have
actually read Akaike’s papers." [quoted from [AIC MYTHS AND MISUNDERSTANDINGS][4] by
Burnham-Anderson]
Aus dem, was Ripley über die AIC und die damit verbundene Theorie schreibt, folgt , dass die Warnung ernst genommen werden sollte. Ich habe sowohl eine gute Sammlung von Akaikes eigenen Papieren als auch das Burnham-Anderson-Buch. Ich werde irgendwann meine eigene Meinung zur Qualität des Buches haben, aber es wird auch hilfreich sein zu wissen, was die Gemeinschaft der jungen und alten Statistiker darüber denkt. Gibt es insbesondere Statistikprofessoren (oder andere gute Statistikstudenten), die das Buch ausdrücklich als nützliche Zusammenfassung des Wissens zur Verwendung von AIC für die Modellauswahl empfohlen haben?
Referenz:
(1) Burnham, KP & Anderson, DR Modellauswahl und Multimodell-Inferenz: ein praktischer informationstheoretischer Ansatz Springer, 2002
PS. Als Antwort auf die jüngste "Antwort", die besagt, dass "Dr.Burnham ein Ph.D.-Statistiker ist", möchte ich diese Klarstellung hinzufügen. Ja, er selbst ist Statistiker, Fellow der ASA und erhielt zahlreiche Auszeichnungen, darunter die Distinguished Achievement Medal der ASA. Aber wer sagt, dass er nicht ist? Alles, was ich oben gesagt habe, ist, dass sie als Autorenpaar keine Statistiker sind, und das Buch spiegelt diese Tatsache wider.
quelle
Antworten:
Das OP scheint eine qualitativ hochwertige Umfrage unter qualitativ hochwertigen Statistikern anzustreben, um zu beurteilen, ob ein bestimmtes Buch von hoher Qualität ist, insbesondere im Hinblick auf die Debatte zwischen AIC und AICc. Diese Seite ist nicht speziell auf systematische Erhebungen ausgerichtet. Stattdessen werde ich versuchen, die zugrunde liegende Frage direkt anzusprechen.
Der AIC und der AICc bewerten beide Modelle nach einem heuristischen Kompromiss zwischen Modellanpassung (in Bezug auf die Wahrscheinlichkeit) und Überanpassung (in Bezug auf die Anzahl der Parameter). In diesem Kompromiss gibt der AICc der Anzahl der Parameter einen etwas größeren Nachteil. Daher empfiehlt der AICc immer Modelle zu bevorzugen, deren Komplexität kleiner oder gleich der Komplexität des besten AIC-Modells ist. In diesem Sinne ist die Beziehung zwischen den beiden sehr einfach, trotz der schrecklich komplizierten Argumente, die ihren Ableitungen zugrunde liegen.
Der AIC und der AICc sind nur zwei von vielen Informationskriterien für Kandidaten, wobei der BIC und der DIC möglicherweise die führenden Alternativen sind. Der BIC ist in den meisten Fällen weitaus konservativer (Bestrafung einer großen Anzahl von Modellparametern) als der AIC oder der AICc. Die Frage, welches Kriterium das beste ist, ist wirklich problemspezifisch. In Fällen, in denen eine zuverlässige Vorhersage außerhalb der Stichprobe erforderlich ist, könnte man zu Recht ein äußerst konservatives Kriterium vorziehen.
FWIW fand ich, dass das Konservativitätsniveau des AICc in umfangreichen Simulationsstudien zum Vorhersagefehler in Capture-Recapture-Modellen dem AIC typischerweise vorzuziehen ist.
quelle