logit - Koeffizienten als Wahrscheinlichkeiten interpretieren

9

Mir scheinen wichtige Informationen zu fehlen. Mir ist bekannt, dass der logistische Regressionskoeffizient in log (Quoten) angegeben ist, der so genannten Logit-Skala. Daher wird zur Interpretation exp(coef)genommen und ergibt OR, das Odds Ratio.

Wenn ist, lautet die Interpretation wie folgt: Für eine Erhöhung der Kovariate eine Einheit beträgt das logarithmische Quotenverhältnis 0,012 - was keine aussagekräftigen Informationen liefert.β1=0.012X1

Die Potenzierung ergibt, dass für eine Einheitszunahme in der Kovariate das Quotenverhältnis 1,012 ( ) beträgt oder 1,012 wahrscheinlicher als .X1exp(0.012)=1.012Y=1Y=0

Aber ich möchte den Koeffizienten als Prozentsatz ausdrücken. Nach Gelman und Hill in der Datenanalyse unter Verwendung von Regression und mehrstufigen / hierarchischen Modellen , S. 111:

Die Koeffizienten β können potenziert und als multiplikative Effekte behandelt werden. "

Wenn also β1 = 0,012, dann ist "der erwartete multiplikative Anstieg exp (0,012) = 1,012 oder eine positive Differenz von 1,2% ...

Allerdings nach meinen Skripten

ODDS=p1p

und die inverse Logit-Formelzustände

P=OR1+OR=1.0122.012=0.502

Was ich zu interpretieren versucht bin, als ob die Kovariate um eine Einheit zunimmt, erhöht sich die Wahrscheinlichkeit von Y = 1 um 50% - was ich für falsch halte, aber ich verstehe nicht warum.

Wie können Logit-Koeffizienten in Bezug auf Wahrscheinlichkeiten interpretiert werden?

user1607
quelle
(1) Sie scheinen die Gewinnchancen und das Gewinnchancenverhältnis miteinander zu verbinden: Es sind verschiedene Dinge. (2) Seien Sie mit Ihrer Arithmetik ein wenig vorsichtig. Sie haben es mit kleinen Änderungen zu tun, daher benötigen Sie eine ausreichende Präzision, um sie auszudrücken. Für 1.012 / 2.012 erhalte ich 0,5030 (auf vier signifikante Zahlen), was - als relative Änderung gegenüber 0,50 - 50% größer ist als Ihre Zahl! (3) Wir haben mehrere gute Themen zur Interpretation logistischer Regressionskoeffizienten und ORs. Warum suchst du nicht nach ihnen und siehst sie dir an?
whuber
1
@whuber danke. Ich habe noch mehr gesucht und die Antworten gefunden. Ich habe meine Ergebnisse in der Antwort unten zusammengefasst. Hoffentlich ist es auch für einige andere Benutzer hilfreich!
user1607

Antworten:

14

Diese Quotenverhältnisse sind das Exponential des entsprechenden Regressionskoeffizienten:

odds ratio=eβ^

Wenn der logistische Regressionskoeffizient beispielsweise ist, beträgt das Quotenverhältnis .β^=0.25e0.25=1.28

Das Odds Ratio ist der Multiplikator, der zeigt, wie sich die Odds Ratio für eine Erhöhung des X-Werts um eine Einheit ändert. Das Odds Ratio erhöht sich um den Faktor 1,28. Wenn also das anfängliche Quotenverhältnis beispielsweise 0,25 betrug, wird das Quotenverhältnis nach einer Erhöhung der Kovariate um eine Einheit .0.25×1.28

Eine andere Möglichkeit, das Odds Ratio zu interpretieren, besteht darin, den Bruchteil zu betrachten und ihn als prozentuale Änderung zu interpretieren. Zum Beispiel entspricht das Quotenverhältnis von 1,28 einer Erhöhung der Quoten um 28% für eine Erhöhung des entsprechenden X um 1 Einheit.

Wenn es sich um einen abnehmenden Effekt handelt (OR <1), z. B. Odds Ratio = 0,94, verringert sich die Wahrscheinlichkeit für eine Erhöhung des entsprechenden X um 1 Einheit um 6%.

Die Formel lautet:

Percent Change in the Odds=(Odds Ratio1)×100
user1607
quelle
+1: gute Erklärung.
whuber
@ user1607 das macht Sinn. Ich sehe jedoch nicht, wie es die Frage beantwortet, ob die inverse Protokollierung zum Abrufen von Wahrscheinlichkeiten der richtige Weg ist oder nicht.
Blade Runner
7

Ein Teil des Problems ist, dass Sie einen Satz von Gelman und Hill aus dem Zusammenhang nehmen. Hier ist ein Screenshot von Google Büchern:

Geben Sie hier die Bildbeschreibung ein

Beachten Sie, dass in der Überschrift "Interpretieren von Poisson-Regressionskoeffizienten " steht (Hervorhebung hinzugefügt). Die Poisson-Regression verwendet einen logarithmischen Link, im Gegensatz zur logistischen Regression, die einen Logit-Link (Log-Odds) verwendet. Die Interpretation von potenzierten Koeffizienten als multiplikative Effekte funktioniert nur für logarithmische Koeffizienten (oder, bei Gefahr, das Wasser leicht zu trüben, für logitische Koeffizienten, wenn das Grundlinienrisiko sehr gering ist ...)

Jeder möchte in der Lage sein, die Auswirkungen von Behandlungen auf Wahrscheinlichkeiten auf einfache, universelle, skalenunabhängige Weise zu zitieren, aber dies ist grundsätzlich unmöglich: Aus diesem Grund gibt es so viele Tutorials zur Interpretation von Quoten und Log-Quoten, die in freier Wildbahn im Umlauf sind, und warum Epidemiologen so viel Zeit damit verbringen, über das relative Risiko-Quoten-Verhältnis gegen ...

Ben Bolker
quelle
4

Wenn Sie in Prozent interpretieren möchten, benötigen Sie den y-Achsenabschnitt ( ). Wenn Sie das Exponential des Abschnitts nehmen, erhalten Sie die Wahrscheinlichkeit, wenn alle Kovariaten 0 sind. Dann können Sie mit dem Quotenverhältnis eines bestimmten Terms multiplizieren, um zu bestimmen, wie hoch die Wahrscheinlichkeit wäre, wenn diese Kovariate 1 statt 0 ist. β0

Die obige inverse Logit-Transformation kann auf die Gewinnchancen angewendet werden, um die prozentuale Chance von .Y=1

Also wenn alle :x=0

p(Y=1)=eβ01+eβ0

und wenn (und alle anderen Kovariaten sind 0), dann:x1=1

p(Y=1)=e(β0+β1)1+e(β0+β1)

und diese können verglichen werden. Beachten Sie jedoch, dass der Effekt von je nach ist. Es handelt sich nicht um einen konstanten Effekt wie bei der linearen Regression, sondern nur um eine Konstante auf der Log-Odds-Skala.x1β0

Beachten Sie auch, dass Ihre Schätzung von davon abhängt, wie die Daten gesammelt wurden. Eine Fall-Kontroll-Studie, bei der die gleiche Anzahl von Probanden mit und ausgewählt wird und deren Wert von beobachtet wird, kann eine ganz andere Schätzung als eine einfache Zufallsstichprobe und die Interpretation des Prozentsatzes (der Prozentsätze) ergeben ) von der ersten könnte als Interpretation dessen, was im zweiten Fall passieren würde, bedeutungslos sein.β0Y=0Y=1xβ0

Greg Snow
quelle