Um die modellgemittelten Vorhersagen auf der Antwortskala eines GLM zu berechnen, welche ist "korrekt" und warum?
- Berechnen Sie die modellgemittelte Vorhersage auf der Verbindungsskala und transformieren Sie sie anschließend auf die Antwortskala zurück
- Transformieren Sie die Vorhersagen in die Antwortskala und berechnen Sie dann den Modelldurchschnitt
Die Vorhersagen sind nahe beieinander, aber nicht gleich, wenn das Modell ein GLM ist. Die verschiedenen R-Pakete bieten Optionen für beide (mit unterschiedlichen Standardeinstellungen). Mehrere Kollegen haben lautstark argumentiert, dass # 1 falsch ist, weil "jeder # 2 macht". Meine Intuition sagt, dass # 1 "korrekt" ist, da es alle linearen mathematischen Werte linear hält (# 2 mittelt Dinge, die sich nicht auf einer linearen Skala befinden). Eine einfache Simulation zeigt, dass # 2 eine sehr (sehr!) Geringfügig kleinere MSE als # 1 hat. Wenn # 2 korrekt ist, warum? Und wenn # 2 richtig ist, warum ist meine Argumentation (lineare Mathematik linear halten) schlecht?
Edit 1: Das Berechnen von Grenzmitteln über die Ebenen eines anderen Faktors in einem GLM ist ein ähnliches Problem wie die Frage, die ich oben stelle. Russell Lenth berechnet marginale Mittelwerte von GLM-Modellen unter Verwendung des "Timings" (seiner Wörter) von # 1 (im Emmeans-Paket), und sein Argument ähnelt meiner Intuition.
Bearbeiten 2: Ich verwende die Modellmittelung, um auf die Alternative zur Modellauswahl zu verweisen, bei der eine Vorhersage (oder ein Koeffizient) als gewichteter Durchschnitt über alle oder eine Teilmenge der "besten" verschachtelten Modelle geschätzt wird (siehe Referenzen und R-Pakete unten). .
Bei verschachtelten Modellen, wobei die lineare Vorhersage (im Verknüpfungsraum) für das individuelle für das Modell ist und die Gewichtung für das Modell , die modellgemittelte Vorhersage unter Verwendung von # 1 oben (Durchschnitt auf der Verknüpfung) skalieren und dann auf die Antwortskala zurücktransformieren) ist:
und die modellgemittelte Vorhersage unter Verwendung von # 2 oben (alle Vorhersagen rücktransformieren und dann auf der Antwortskala mitteln) ist:
Einige Bayesian und Frequentist Methoden der Modellmittelung sind:
Hoeting, JA, Madigan, D., Raftery, AE und Volinsky, CT, 1999. Bayesianische Modellmittelung: Ein Tutorial. Statistical Science, S. 382-401.
Burnham, KP und Anderson, DR, 2003. Modellauswahl und Multimodell-Inferenz: ein praktischer informationstheoretischer Ansatz. Springer Science & Business Media.
Hansen, BE, 2007. Modellmittelung der kleinsten Quadrate. Econometrica, 75 (4), S. 1175–1189.
Claeskens, G. und Hjort, NL, 2008. Modellauswahl und Modellmittelung. Cambridge Bücher.
R-Pakete umfassen BMA , MuMIn , BAS und AICcmodavg . (Hinweis: Dies ist keine Frage der Weisheit der Modellmittelung im Allgemeinen.)
Antworten:
Die optimale Art, Schätzer oder Prädiktoren zu kombinieren, hängt von der Verlustfunktion ab, die Sie zu minimieren versuchen (oder von der Dienstprogrammfunktion, die Sie zu maximieren versuchen).
Wenn die Verlustfunktion Prädiktionsfehler auf der Antwortskala misst, sind im Allgemeinen die Mittelungsprädiktoren auf der Antwortskala korrekt. Wenn Sie beispielsweise den erwarteten quadratischen Vorhersagefehler auf der Antwortskala minimieren möchten, ist der hintere mittlere Vorhersagefaktor optimal und kann abhängig von Ihren Modellannahmen der Mittelwertbildung auf der Antwortskala entsprechen.
Beachten Sie, dass die Mittelwertbildung auf der linearen Prädiktorskala für diskrete Modelle sehr schlecht sein kann. Angenommen, Sie verwenden eine logistische Regression, um die Wahrscheinlichkeit einer binären Antwortvariablen vorherzusagen. Wenn eines der Modelle eine geschätzte Wahrscheinlichkeit von Null angibt, ist der lineare Prädiktor für dieses Modell minus unendlich. Der Durchschnitt der Unendlichkeit mit einer beliebigen Anzahl von endlichen Werten wird immer noch unendlich sein.
Haben Sie die Referenzen konsultiert, die Sie auflisten? Ich bin sicher, dass Hoeting et al. (1999) zum Beispiel Verlustfunktionen diskutieren, wenn auch vielleicht nicht sehr detailliert.
quelle