Äquivalenz von AIC- und p-Werten bei der Modellauswahl

9

In einem Kommentar zur Antwort auf diese Frage wurde festgestellt, dass die Verwendung von AIC bei der Modellauswahl der Verwendung eines p-Werts von 0,154 entspricht.

Ich habe es in R versucht, wo ich einen "Rückwärts" -Untergruppenauswahlalgorithmus verwendet habe, um Variablen aus einer vollständigen Spezifikation herauszuwerfen. Erstens durch sequentielles Auswerfen der Variablen mit dem höchsten p-Wert und Stoppen, wenn alle p-Werte unter 0,154 liegen, und zweitens durch Löschen der Variablen, die beim Entfernen zu einem niedrigsten AIC führt, bis keine Verbesserung mehr erzielt werden kann.

Es stellte sich heraus, dass sie ungefähr die gleichen Ergebnisse liefern, wenn ich einen p-Wert von 0,154 als Schwellenwert verwende.

Ist das tatsächlich wahr? Wenn ja, weiß jemand warum oder kann auf eine Quelle verweisen, die dies erklärt?

PS Ich konnte die kommentierende Person nicht fragen oder einen Kommentar schreiben, weil ich mich gerade angemeldet habe. Mir ist bewusst, dass dies nicht der am besten geeignete Ansatz für die Modellauswahl und -inferenz usw. ist.

Niels
quelle
(1) Prognostische Modellierung mit logistischer Regressionsanalyse: Vergleich von Auswahl- und Schätzmethoden in kleinen Datensätzen. Statistics in Medicine, 19, 1059-1079 (2) wahr für Variablen mit df1, basierend auf einer Definition.
Könnte

Antworten:

13

χ2χ2α=0,157αα

Frank Harrell
quelle
+1 Ich habe so lange damit verbracht, meine (jetzt gelöschte) Antwort zu erstellen, dass ich nicht einmal gesehen habe, dass diese in der Zwischenzeit veröffentlicht wurde. Ich hätte stattdessen nur dieses abgestimmt.
Glen_b -Reinstate Monica