Was ist der Unterschied zwischen binomialer und logistischer Regression?

20

Ich habe die logistische Regression immer als einen speziellen Fall der binomischen Regression betrachtet, bei dem die Verknüpfungsfunktion die logistische Funktion ist (anstelle einer Probit-Funktion).

Nach dem Lesen der Antworten auf eine andere Frage, die ich hatte, könnte ich verwirrt sein, und es gibt einen Unterschied zwischen logistischer Regression und binomialer Regression mit einer logistischen Verknüpfung.

Was ist der Unterschied?

raegtin
quelle

Antworten:

13

Die logistische Regression ist eine binomische Regression mit der Verknüpfungsfunktion "Logistik":

g(p)=log(p1p)=Xβ

Obwohl ich auch denke, dass die logistische Regression normalerweise auf binomische Proportionen und nicht auf binomische Zählungen angewendet wird.

Wahrscheinlichkeitslogik
quelle
1
Was meinen Sie mit logistischer Regression, die normalerweise auf Proportionen und nicht auf Zählungen angewendet wird? Angenommen, ich versuche vorherzusagen, ob Personen an einer Party teilnehmen werden oder nicht, und für eine bestimmte Party weiß ich, dass 9 Personen teilgenommen haben und 1 nicht - meinst du, dass logistische Regression dies als ein Trainingsbeispiel nimmt (dh diese Partei hatte eine Erfolgsrate von 0,9), während die binomiale Regression mit einem Link dies als 10 Trainingsbeispiele (9 Erfolge, 1 Misserfolg) annehmen würde?
Raegtin
@raehtin - in beiden Fällen wäre es Probe / Trainingsfall mit ( n i , f i ) = ( 10 , 0,9 ) bzw. ( n i , x i ) = ( 10 , 9 ) . Der Unterschied ist die Form der Mittel- und Varianzfunktionen. Für das Binomial ist der Mittelwert μ i = n i p i , die kanonische Verknüpfung ist jetzt log ( μ i1(ni,fi)=(10,0.9)(ni,xi)=(10,9)μi=nipi(auch "natürlicher Parameter" genannt) und die Varianzfunktion istV(μi)=μi(ni-μi)log(μiniμi) mit Dispersionsparameterϕi=1. Für die Logistik gilt:μi=pi, obiger Zusammenhang, Varianzfunktion vonV(μi)=μi(1-μi)und Dispersion gleichϕi=1V(μi)=μi(niμi)niϕi=1μi=piV(μi)=μi(1μi) . ϕi=1ni
Wahrscheinlichkeitslogik
Mit logistic wird das von der Mittelwert- und der Varianzfunktion getrennt, so dass es leichter über weighting berücksichtigt werden kannni
Wahrscheinlichkeitslogik
Ah, verstanden, ich glaube ich verstehe. Bedeutet dies, dass sie äquivalente Ergebnisse liefern (einfach auf eine andere Weise ermittelt)?
Raegtin
1
@raegtin - ich denke schon. Die GLM-Gewichte , ist in beiden Fällen gleich, und die Verknüpfungsfunktion erzeugt den gleichen logit Wert. So lange die X-Variablen auch gleich sind, sollte es die gleichen Ergebnisse geben. wi2=1ϕiV(μi)[g(μi)]2
Wahrscheinlichkeitslogik
4

Binomialen Regression ist jede Art von GLM eine binomische mean-Varianzbeziehung unter Verwendung von in dem die Varianz ist gegeben durch . In der logistischen Regression Y = logit - 1 ( X β ) = 1 / ( 1 - exp ( X β ) )var(Y)=Y^(1Y^)Y^=logit1(Xβ^)=1/(1exp(Xβ^))mit der Logit-Funktion, die als "Link" -Funktion bezeichnet wird. Eine allgemeine Klasse von binomialen Regressionsmodellen kann jedoch mit jeder Art von Verknüpfungsfunktion definiert werden, auch mit Funktionen, die einen Bereich außerhalb von ausgeben . Beispielsweise nimmt die Probit-Regression eine Verknüpfung der inversen normalen CDF, die relative Risikoregression als Verknüpfung der Protokollfunktion und additive Risikomodelle das Identity-Link-Modell.[0,1]

AdamO
quelle