Wir arbeiten mit einigen logistischen Regressionen und haben festgestellt, dass die durchschnittliche geschätzte Wahrscheinlichkeit immer dem Anteil derjenigen in der Stichprobe entspricht. Das heißt, der Durchschnitt der angepassten Werte entspricht dem Durchschnitt der Stichprobe.
Kann mir jemand den Grund erklären oder eine Referenz geben, wo ich diese Demonstration finden kann?
Antworten:
Das Verhalten, das Sie beobachten, ist der "typische" Fall bei der logistischen Regression, aber nicht immer wahr. Es gilt auch in viel allgemeinerer Form (siehe unten). Es ist die Folge des Zusammentreffens von drei verschiedenen Tatsachen.
Wenn eine der oben genannten Aussagen nicht vorliegt, stimmen die geschätzten Durchschnittswahrscheinlichkeiten im Allgemeinen nicht mit dem Anteil derjenigen in der Stichprobe überein.
(Fast) jede statistische Software verwendet jedoch eine Maximum-Likelihood-Schätzung für solche Modelle, sodass in der Praxis die Elemente 1 und 2 im Wesentlichen immer vorhanden sind und Element 3 normalerweise vorhanden ist, außer in besonderen Fällen.
Ein paar Details
Im typischen logistischen Regressionsgerüst beobachten wir das Ergebnis unabhängiger Binomialversuche mit der Wahrscheinlichkeit . Lassen Sie y i die beobachteten Reaktionen sein. Dann ist die Gesamtwahrscheinlichkeit L = n Π i = 1 p y i i ( 1 - p i ) 1 - y i = n Π i = 1 exp ( y i log ( P i / ( 1 - P ipich yich
Und so die Log-Likelihood ist
ℓ = n Σ i = 1 y i log ( P i / ( 1 - p i ) ) + n Σ i = 1 log ( 1 - P i )
Wir haben nun einen Vektor von Prädiktoren für jede Beobachtung und aus dem obigen Fakt 1 geht das logistische Regressionsmodell für einige Unbekannte von aus Vektor der Parameter . Hinweis : Wenn Sie dies neu ordnen, erhalten Sie .xich β p i = 1 / ( 1 + e - β T x i )
Wenn die maximale Wahrscheinlichkeit für die Anpassung an das Modell (Fakt 2) verwendet wird, ergibt sich ein Satz zu lösender Gleichungen aus der Berücksichtigung von . Beachten Sie, dass∂ℓ / ∂β= 0
Eine Simulation
Allgemeiner Fall : Wie oben erwähnt, ist die Eigenschaft, dass die mittlere Antwort gleich dem vorhergesagten Durchschnittswert ist, für die Klasse verallgemeinerter linearer Modelle, die mit maximaler Wahrscheinlichkeit unter Verwendung der kanonischen Verknüpfungsfunktion und unter Einbeziehung eines Abschnitts in die Gleichung passen, viel allgemeiner Modell.
Verweise
Einige gute Referenzen für die zugehörige Theorie sind die folgenden.
quelle