Warum werden potenzierte logistische Regressionskoeffizienten als „Odds Ratios“ betrachtet?

10

Die logistische Regression modelliert die logarithmischen Quoten eines Ereignisses als eine Reihe von Prädiktoren. Das heißt, log (p / (1-p)), wobei p die Wahrscheinlichkeit eines Ergebnisses ist. Daher muss die Interpretation der rohen logistischen Regressionskoeffizienten für eine Variable (x) auf der logarithmischen Quotenskala liegen. Das heißt, wenn der Koeffizient für x = 5 ist, wissen wir, dass eine Änderung von 1 Einheit in x einer Änderung von 5 Einheiten auf der logarithmischen Quotenskala entspricht, dass ein Ergebnis auftritt.

Ich sehe jedoch oft Leute, die potenzierte logistische Regressionskoeffizienten als Quotenverhältnisse interpretieren . Es ist jedoch eindeutig exp (log (p / (1-p))) = p / (1-p), was eine Quote ist. Soweit ich es verstehe, ist ein Quotenverhältnis die Wahrscheinlichkeit, dass ein Ereignis auftritt (z. B. p / (1-p) für Ereignis A), gegenüber der Wahrscheinlichkeit, dass ein anderes Ereignis auftritt (z. B. p / (1-p) für Ereignis) B).

Was fehlt mir hier? Es scheint, dass diese übliche Interpretation von potenzierten logistischen Regressionskoeffizienten falsch ist.

Jack
quelle

Antworten:

10

Die Antwort von @ Laconic ist meiner Meinung nach großartig und vollständig. Ich wollte hinzufügen, dass die ursprünglichen Koeffizienten einen Unterschied in den Log-Quoten für zwei Einheiten beschreiben, die sich im Prädiktor um 1 unterscheiden. Zum Beispiel können wir für einen Koeffizienten auf von 5 sagen, dass der Unterschied in den logarithmischen Quoten zwischen zwei Einheiten, die sich auf um 1 unterscheiden, 5 ist.XX

β=log(odds(p|X=x0+1))log(odds(p|X=x0))

Wenn Sie , erhalten Sieβ

exp(β)=exp(log(odds(p|X=x0+1))log(odds(p|X=x0)))=exp(log(odds(p|X=x0+1)))exp(log(odds((p|X=x0)))=odds(p|X=x0+1)odds(p|X=x0))

Das ist ein Quotenverhältnis, ein Quotenverhältnis.

Noah
quelle
2
Das ist mir sehr klar. Meine Frage ist gelöst.
Jack
10

Man betrachte zwei Bedingungen, die erste, die durch den Vektor der unabhängigen Variablen , und die zweite, die durch den Vektor , der sich nur in der i-ten Variablen , und um eine Einheit. Sei wie üblich der Vektor der Modellparameter.XXxiβ

Gemäß dem logistischen Regressionsmodell beträgt die Wahrscheinlichkeit des Auftretens des Ereignisses im ersten Fall , so dass die Wahrscheinlichkeit des Eintretens des Ereignisses .p1=11+exp(Xβ)p11p1=exp(Xβ)

Die Wahrscheinlichkeit, dass das Ereignis im zweiten Fall auftritt, ist , so dass die Wahrscheinlichkeit, dass das Ereignis auftritt, .p2=11+exp(Xβ)p21p2=exp(Xβ)=exp(Xβ+βi)

Das Verhältnis der Gewinnchancen im zweiten Fall zu den Gewinnchancen im ersten Fall ist daher . Daher die Interpretation des Exponentials des Parameters als Odds Ratio.exp(βi)

Der Lakoniker
quelle