Die logistische Regression modelliert die logarithmischen Quoten eines Ereignisses als eine Reihe von Prädiktoren. Das heißt, log (p / (1-p)), wobei p die Wahrscheinlichkeit eines Ergebnisses ist. Daher muss die Interpretation der rohen logistischen Regressionskoeffizienten für eine Variable (x) auf der logarithmischen Quotenskala liegen. Das heißt, wenn der Koeffizient für x = 5 ist, wissen wir, dass eine Änderung von 1 Einheit in x einer Änderung von 5 Einheiten auf der logarithmischen Quotenskala entspricht, dass ein Ergebnis auftritt.
Ich sehe jedoch oft Leute, die potenzierte logistische Regressionskoeffizienten als Quotenverhältnisse interpretieren . Es ist jedoch eindeutig exp (log (p / (1-p))) = p / (1-p), was eine Quote ist. Soweit ich es verstehe, ist ein Quotenverhältnis die Wahrscheinlichkeit, dass ein Ereignis auftritt (z. B. p / (1-p) für Ereignis A), gegenüber der Wahrscheinlichkeit, dass ein anderes Ereignis auftritt (z. B. p / (1-p) für Ereignis) B).
Was fehlt mir hier? Es scheint, dass diese übliche Interpretation von potenzierten logistischen Regressionskoeffizienten falsch ist.
quelle
Man betrachte zwei Bedingungen, die erste, die durch den Vektor der unabhängigen Variablen , und die zweite, die durch den Vektor , der sich nur in der i-ten Variablen , und um eine Einheit. Sei wie üblich der Vektor der Modellparameter.X X′ xi β
Gemäß dem logistischen Regressionsmodell beträgt die Wahrscheinlichkeit des Auftretens des Ereignisses im ersten Fall , so dass die Wahrscheinlichkeit des Eintretens des Ereignisses .p1=11+exp(−Xβ) p11−p1=exp(Xβ)
Die Wahrscheinlichkeit, dass das Ereignis im zweiten Fall auftritt, ist , so dass die Wahrscheinlichkeit, dass das Ereignis auftritt, .p2=11+exp(−X′β) p21−p2=exp(X′β)=exp(Xβ+βi)
Das Verhältnis der Gewinnchancen im zweiten Fall zu den Gewinnchancen im ersten Fall ist daher . Daher die Interpretation des Exponentials des Parameters als Odds Ratio.exp(βi)
quelle