Warum sollten Sie bei der logistischen Regression Quoten und nicht Wahrscheinlichkeiten verwenden?

8

Warum sollten wir bei der logistischen Regression Quoten anstelle von Wahrscheinlichkeiten verwenden?

Kenny
quelle

Antworten:

22

Der Vorteil ist, dass die auf definierten Quoten den Log-Quoten , während dies bei Wahrscheinlichkeiten nicht der Fall ist. Infolgedessen können Sie Regressionsgleichungen wie für das Protokoll verwenden -odds ohne Probleme (dh für jeden Wert der Regressionskoeffizienten und Kovariaten wird ein gültiger Wert für die Gewinnchancen vorhergesagt). Sie würden extrem komplizierte mehrdimensionale Einschränkungen für die Regressionskoeffizienten benötigen(0,)(,)

log(pi1pi)=β0+j=1Jβjxij
β0,β1,, wenn Sie dasselbe für die Protokollwahrscheinlichkeit tun möchten (und dies würde natürlich auch für die nicht transformierte Wahrscheinlichkeit oder die nicht transformierten Gewinnchancen nicht einfach funktionieren). Infolgedessen erhalten Sie Effekte wie die Unfähigkeit, über alle Basiswahrscheinlichkeiten hinweg ein konstantes Risikoverhältnis zu haben (einige Risikoverhältnisse würden zu Wahrscheinlichkeiten> 1 führen), während dies bei einem Odds-Ratio kein Problem darstellt.
Björn
quelle
17

Die Wahrscheinlichkeit ist die erwartete Anzahl von "Erfolgen" pro "Misserfolg", daher können Werte kleiner als eins, eins oder mehr als eins angenommen werden, negative Werte sind jedoch nicht sinnvoll. Sie können 3 Erfolge pro Fehler erzielen, aber -3 Erfolge pro Fehler sind nicht sinnvoll. Der Logarithmus einer Quote kann einen beliebigen positiven oder negativen Wert annehmen. Die logistische Regression ist ein lineares Modell für das Protokoll (Quoten). Dies funktioniert, weil das Protokoll (die Gewinnchancen) eine beliebige positive oder negative Zahl annehmen kann, sodass ein lineares Modell nicht zu unmöglichen Vorhersagen führt. Wir können ein lineares Modell für die Wahrscheinlichkeit erstellen, ein lineares Wahrscheinlichkeitsmodell, aber das kann zu unmöglichen Vorhersagen führen, da eine Wahrscheinlichkeit zwischen 0 und 1 bleiben muss.

Maarten Buis
quelle