Kann das Burnham-Anderson-Buch über Multimodell-Inferenz empfohlen werden?

14

Angesichts der jüngsten Änderung der Standardmodellauswahlstatistik im Prognosepaket des R von AIC auf AICc bin ich gespannt, ob letzteres tatsächlich überall anwendbar ist. Ich habe diesbezüglich eine Reihe von Fragen, und hier ist die erste.

Ich weiß, dass das bekannte Buch in (1) von Burnham und Anderson (Nicht-Statistiker), wie hier zusammengefasst , empfiehlt , AIC überall durch AICc zu ersetzen . Auf das Buch wird von jüngeren Statistikern manchmal unkritisch Bezug genommen, siehe z. B. Kommentare zu diesem Blog-Beitrag von Rob Hyndman , aber der Statistiker Brian Ripley riet auf radikal andere Weise:

“Burnham and Anderson (2002) is a book I would recommend people NOT read until 
they have read the primary literature. I see no evidence that the authors have 
actually read Akaike’s papers." [quoted from [AIC MYTHS AND MISUNDERSTANDINGS][4] by
Burnham-Anderson]

Aus dem, was Ripley über die AIC und die damit verbundene Theorie schreibt, folgt , dass die Warnung ernst genommen werden sollte. Ich habe sowohl eine gute Sammlung von Akaikes eigenen Papieren als auch das Burnham-Anderson-Buch. Ich werde irgendwann meine eigene Meinung zur Qualität des Buches haben, aber es wird auch hilfreich sein zu wissen, was die Gemeinschaft der jungen und alten Statistiker darüber denkt. Gibt es insbesondere Statistikprofessoren (oder andere gute Statistikstudenten), die das Buch ausdrücklich als nützliche Zusammenfassung des Wissens zur Verwendung von AIC für die Modellauswahl empfohlen haben?

Referenz:

(1) Burnham, KP & Anderson, DR Modellauswahl und Multimodell-Inferenz: ein praktischer informationstheoretischer Ansatz Springer, 2002

PS. Als Antwort auf die jüngste "Antwort", die besagt, dass "Dr.Burnham ein Ph.D.-Statistiker ist", möchte ich diese Klarstellung hinzufügen. Ja, er selbst ist Statistiker, Fellow der ASA und erhielt zahlreiche Auszeichnungen, darunter die Distinguished Achievement Medal der ASA. Aber wer sagt, dass er nicht ist? Alles, was ich oben gesagt habe, ist, dass sie als Autorenpaar keine Statistiker sind, und das Buch spiegelt diese Tatsache wider.

Winterschlaf halten
quelle
2
Das Paper "AIC Mythen und Missverständnisse" finden Sie hier . Ich hatte es nicht gesehen (obwohl ich zuvor Ripleys Kommentar gesehen hatte).
Glen_b
3
Die Frage enthält Links, aber ich denke, es wäre hilfreich für die Leser, wenn die Frage selbst einen Hinweis darauf geben würde, was am Inhalt von Burnham und Andersons Buch schlecht sein könnte. (Wenn das, was sie sagen, genau, klar, hilfreich usw. ist, spielt es keine Rolle, ob sie tatsächlich Akaikes Papiere lesen.) Außerdem scheinen mir AIC und verwandte Methoden immer noch umstritten zu sein; Wenn ja, dann hat jedes Buch, das sie vorstellt, Kritiker. Und ein Vorschlag, dass jeder die Originalarbeiten lesen muss, bevor er ein Buch liest, das eine Einführung in ein Thema bieten soll, erscheint fraglich.
Mars
7
Ich habe Akaikes zwei Hauptartikel gelesen, und Schwarzs im BIC, und Burnham und Andersons Buch (es steht gerade in meinem Regal) und (wie Sie sehen) auch Ripleys kurze Kritik. Ich mag sehr viel sehen Ripley erklärt die Kritik im Detail (ohne die Verleumdungen über wer etwas haben lesen kann) - wie die Dinge stehen, gibt es wirklich nichts materiell für Burnham und Anderson zu antworten. Wenn etwas dran ist (und es kann sein, dass es alles gibt, was ich weiß), verdient es mehr als ein paar Zeilen auf einer R-Help-Mailingliste.
Glen_b
2
@Gleb_b Ripleys Ansichten lassen sich aus seinem 1996 erschienenen Buch über die Mustererkennung ableiten, auf das er in diesem Beitrag in der R-Liste Bezug nahm, siehe z Lassen Sie mich glauben, dass er dieses Gebiet gut versteht und mehr als nur ein paar von Akaikes Zeitungen gelesen hat.
Winterschlaf
3
Zwei Cent anders setzen: Wie oft geben AIC und AICc unterschiedliche Ratschläge? Nach meiner Erfahrung schlagen sie die gleichen Modelle vor.
Peter Flom - Wiedereinsetzung von Monica

Antworten:

3

Das OP scheint eine qualitativ hochwertige Umfrage unter qualitativ hochwertigen Statistikern anzustreben, um zu beurteilen, ob ein bestimmtes Buch von hoher Qualität ist, insbesondere im Hinblick auf die Debatte zwischen AIC und AICc. Diese Seite ist nicht speziell auf systematische Erhebungen ausgerichtet. Stattdessen werde ich versuchen, die zugrunde liegende Frage direkt anzusprechen.

Der AIC und der AICc bewerten beide Modelle nach einem heuristischen Kompromiss zwischen Modellanpassung (in Bezug auf die Wahrscheinlichkeit) und Überanpassung (in Bezug auf die Anzahl der Parameter). In diesem Kompromiss gibt der AICc der Anzahl der Parameter einen etwas größeren Nachteil. Daher empfiehlt der AICc immer Modelle zu bevorzugen, deren Komplexität kleiner oder gleich der Komplexität des besten AIC-Modells ist. In diesem Sinne ist die Beziehung zwischen den beiden sehr einfach, trotz der schrecklich komplizierten Argumente, die ihren Ableitungen zugrunde liegen.

Der AIC und der AICc sind nur zwei von vielen Informationskriterien für Kandidaten, wobei der BIC und der DIC möglicherweise die führenden Alternativen sind. Der BIC ist in den meisten Fällen weitaus konservativer (Bestrafung einer großen Anzahl von Modellparametern) als der AIC oder der AICc. Die Frage, welches Kriterium das beste ist, ist wirklich problemspezifisch. In Fällen, in denen eine zuverlässige Vorhersage außerhalb der Stichprobe erforderlich ist, könnte man zu Recht ein äußerst konservatives Kriterium vorziehen.

FWIW fand ich, dass das Konservativitätsniveau des AICc in umfangreichen Simulationsstudien zum Vorhersagefehler in Capture-Recapture-Modellen dem AIC typischerweise vorzuziehen ist.

zkurtz
quelle