Diese Frage ist ein Follow-up oder ein Versuch, mögliche Verwirrung in Bezug auf ein Thema zu beseitigen, das ich und viele andere aufgrund des Unterschieds zwischen AIC und BIC als etwas schwierig empfinde. In einer sehr netten Antwort von @ Dave Kellen zu diesem Thema ( /stats//a/767/30589 ) lesen wir:
Ihre Frage impliziert, dass AIC und BIC versuchen, dieselbe Frage zu beantworten, was jedoch nicht zutrifft. AIC versucht, das Modell auszuwählen, das eine unbekannte, hochdimensionale Realität am besten beschreibt. Dies bedeutet, dass die Realität niemals in der Menge der in Betracht gezogenen Kandidatenmodelle enthalten ist. Im Gegenteil, BIC versucht, das WAHRE Modell unter den Kandidaten zu finden. Ich finde es ziemlich seltsam, dass die Realität in einem der Modelle instanziiert ist, die die Forscher auf diesem Weg gebaut haben. Dies ist ein echtes Problem für BIC.
In einem Kommentar unten von @ gui11aume lesen wir:
(-1) Gute Erklärung, aber ich möchte eine Behauptung anfechten. @ Dave Kellen Könnten Sie bitte einen Hinweis geben, wo die Idee, dass das WAHRE Modell im Set für BIC sein muss? Ich möchte dies untersuchen, da die Autoren in diesem Buch überzeugend nachweisen, dass dies nicht der Fall ist. - gui11aume 27. Mai 12 um 21:47 Uhr
Es scheint, dass diese Behauptung von Schwarz selbst stammt (1978), obwohl die Behauptung nicht notwendig war: Von denselben Autoren (wie bei @ gui11aume) lesen wir aus ihrem Artikel "Multimodell-Inferenz: AIC und BIC in der Modellauswahl verstehen" ( Burnham und Anderson, 2004):
Geht die Ableitung von BIC von der Existenz eines wahren Modells aus oder wird bei Verwendung von BIC das wahre Modell in der Modellmenge angenommen? (Die Ableitung von Schwarz spezifizierte diese Bedingungen.) ... Die Antwort ... nein. Das heißt, der BIC (als Grundlage für eine Annäherung an ein bestimmtes Bayes'sches Integral) kann abgeleitet werden, ohne dass angenommen wird, dass das der Ableitung zugrunde liegende Modell wahr ist (siehe z. B. Cavanaugh und Neath 1999; Burnham und Anderson 2002: 293-5). Bei der Anwendung von BIC muss die Modellmenge natürlich nicht das (nicht vorhandene) wahre Modell enthalten, das die vollständige Realität darstellt. Darüber hinaus bedeutet die Konvergenz der Wahrscheinlichkeit des vom BIC ausgewählten Modells zu einem Zielmodell (unter der Idealisierung einer iid-Stichprobe) nicht logisch, dass dieses Zielmodell die wahre datenerzeugende Verteilung sein muss.
Daher denke ich, dass es eine Diskussion oder eine Klarstellung (falls mehr benötigt wird) zu diesem Thema wert ist. Momentan haben wir nur einen Kommentar von @ gui11aume (danke!) Unter einer sehr hoch bewerteten Antwort bezüglich des Unterschieds zwischen AIC und BIC.
quelle
Antworten:
Das Informationskriterium von Schwarz (1978) wurde mit dem Merkmal entworfen, dass es asymptotisch das Modell mit der höheren hinteren Wahrscheinlichkeit auswählt, dh das Modell mit der höheren Wahrscheinlichkeit, wenn die Daten unter gleichen Prioritäten gegeben sind. Also ungefähr wobei bezeichnet "asymptotisch äquivalent" und ist der Posterior des Modells dem Daten . Ich sehe nicht ein, wie dieses Ergebnis davon abhängen würde, ob Modell 1 wahr ist (gibt es überhaupt ein wahres Modell in einem Bayes'schen Rahmen?).
Was meiner Meinung nach für die Verwirrung verantwortlich ist, ist, dass der SIC die andere nette Eigenschaft hat, dass er unter bestimmten Bedingungen das "wahre" Modell asymptotisch auswählt, wenn sich das letztere innerhalb des Modelluniversums befindet. Sowohl AIC als auch SIC sind Spezialfälle des Kriteriums wobei ist der Log - Likelihood - Schätzungen der Parameter , ist die Anzahl der Parameter und ist die Probengröße. Wenn das Modelluniversum aus linearen Gaußschen Modellen besteht, kann gezeigt werden, dass wir Folgendes benötigen:
quelle