Die Ableitung des Vorhersageintervalls für das lineare Modell ist recht einfach: Erhalten einer Formel für Vorhersagegrenzen in einem linearen Modell .
Wie lassen sich die Konfidenz- und Vorhersageintervalle für die angepassten Werte der Logit- und Probit-Regressionen (und GLMs im Allgemeinen) ableiten ?
confidence-interval
generalized-linear-model
logit
prediction-interval
probit
Statistiklerner
quelle
quelle
Antworten:
In GLM ist die Vorhersage eine nichtlineare Funktion des Produkts der Kovariaten mit dem geschätzten Koeffizientenvektor : Endliche Stichprobenverteilung von ist im Allgemeinen unbekannt, aber solange eine maximale Wahrscheinlichkeitsschätzung ist , hat es eine asymptotische Normalverteilung , wobei ist die hessische Matrix der Wahrscheinlichkeitsfunktion in ihrem Maximum. Die p-Werte vonf X β^
Wenn Sie die asymptotische Normalverteilung von (und damit ) verwenden, ist die Verteilung von aufgrund von nichtlinearem immer noch nicht normal . Sie können es ignorieren - erhalten Sie normale Konfidenzgrenzen für und fügen Sie sie in , wobei Sie Grenzen für als .β^ Xβ^ y^ f (zlower,zupper) Xβ f y (ylower,yupper)=(f(zlower),f(zupper))
Eine andere Strategie ( Delta-Methode genannt ) besteht darin, eine Taylor-Erweiterung von um - sie wird in linear sein . Daher können Sie die Verteilung von alsf Xβ^ β^ f(Xβ^)
Dann würde das asymptotische 95% -Konfidenzintervall für so aussehenf(Xβ)
Jetzt müssen Sie nur noch Ausdruck für hessische Matrizen für bestimmte Modelle finden, wie z. B. die logistische Regression in dieser Frage . Und diese Frage bietet einen praktischen Vergleich von Bootstrap, transformierten Normalgrenzen und Delta-Methode für die logistische Regression.
quelle
Wenn alles andere fehlschlägt, können Sie jederzeit Bootstrap-CIs für jede Statistik erstellen. Hier ist ein einfacher Algorithmus:
quelle