Wir werden eine Weile brauchen , um dorthin zu gelangen, aber zusammenfassend multipliziert eine Änderung der Variable, die B entspricht , um eine Einheit das relative Risiko des Ergebnisses (im Vergleich zum Basisergebnis) mit 6,012.
Man könnte dies als einen Anstieg des relativen Risikos um "5012%" ausdrücken , aber das ist eine verwirrende und möglicherweise irreführende Methode, da dies nahelegt, dass wir uns die Änderungen additiv überlegen sollten, wenn uns das multinomiale Logistikmodell tatsächlich nachdrücklich dazu ermutigt multiplikativ denken. Der Modifikator "relativ" ist wichtig, da durch eine Änderung einer Variablen gleichzeitig die vorhergesagten Wahrscheinlichkeiten aller Ergebnisse geändert werden , nicht nur die fraglichen. Daher müssen wir Wahrscheinlichkeiten vergleichen (anhand von Verhältnissen, nicht Differenzen).
Der Rest dieser Antwort enthält die Terminologie und Intuition, die zur korrekten Interpretation dieser Aussagen erforderlich sind.
Hintergrund
Beginnen wir mit der normalen logistischen Regression, bevor wir zum multinomialen Fall übergehen.
Für die abhängige (binäre) Variable und die unabhängigen Variablen lautet das ModellX iYXi
Pr[Y=1]=exp(β1X1+⋯+βmXm)1+exp(β1X1+⋯+βmXm);
äquivalent unter der Annahme ,0≠Pr[Y=1]≠1
Log( ρ ( X1, ⋯ , Xm) ) = logPr [ Y= 1 ]Pr [ Y= 0 ]= β1X1+ ⋯ + βmXm.
(Dies definiert einfach , das ist die Quote als Funktion von .)X iρXich
Indizieren Sie der Allgemeinheit so, dass die Variable und das "B" in der Frage ist (damit ). Das Fixieren der Werte von und das Variieren von um einen kleinen Betrag ergibtX m β m exp ( β m ) = 6,012 X i , 1 ≤ i < m X m δXichXmβmexp( βm) = 6,012Xich, 1 ≤ i < mXmδ
Log( ρ ( ⋯ , Xm+ δ) ) - log( ρ ( ⋯ , Xm) ) = βmδ.
Somit ist die marginale Änderung der Log-Quoten in Bezug auf .x mβm Xm
Um , müssen wir offensichtlich und die linke Seite :δ = 1exp( βm)δ= 1
exp( βm)= exp( βm× 1 )= exp( log( ρ ( ⋯ , Xm+ 1 ) ) - log( ρ ( ⋯ , Xm) ) )= ρ ( ⋯ , Xm+ 1 )ρ ( ⋯ , Xm).
Dies zeigt als Odds Ratio für einen Anstieg von um eine Einheit . Um eine Vorstellung davon zu entwickeln, was dies bedeuten könnte, tabellieren Sie einige Werte für einen Bereich von Startquoten, und runden Sie sie stark ab, um die Muster hervorzuheben:X mexp( βm)Xm
Starting odds Ending odds Starting Pr[Y=1] Ending Pr[Y=1]
0.0001 0.0006 0.0001 0.0006
0.001 0.006 0.001 0.006
0.01 0.06 0.01 0.057
0.1 0.6 0.091 0.38
1. 6. 0.5 0.9
10. 60. 0.91 1.
100. 600. 0.99 1.
Bei sehr kleinen Gewinnchancen, die sehr kleinen Wahrscheinlichkeiten entsprechen, bewirkt eine Erhöhung von um eine Einheit , dass die Gewinnchancen oder die Wahrscheinlichkeit mit etwa 6,012 multipliziert werden. Der multiplikative Faktor nimmt mit zunehmender Wahrscheinlichkeit ab und ist im Wesentlichen verschwunden, sobald die Wahrscheinlichkeit 10 überschreitet (die Wahrscheinlichkeit 0,9 überschreitet).Xm
Als additive Änderung gibt es keinen großen Unterschied zwischen einer Wahrscheinlichkeit von 0,0001 und 0,0006 (es ist nur 0,05%), noch gibt es einen großen Unterschied zwischen 0,99 und 1 (nur 1%). Der größte additive Effekt tritt auf, wenn die Quote , wobei sich die Wahrscheinlichkeit von 29% auf 71% ändert: eine Änderung von + 42%.1 / 6.012----√~ 0.408
Wir sehen also, dass, wenn wir "Risiko" als Odds Ratio ausdrücken, = "B" eine einfache Interpretation hat - das Odds Ratio ist gleich für eine Einheitserhöhung von aber wenn wir in einigen Fällen Risiko ausdrücken Auf andere Weise, beispielsweise bei einer Änderung der Wahrscheinlichkeiten, erfordert die Interpretation Sorgfalt bei der Angabe der Startwahrscheinlichkeit.β m X mβmβmXm
Multinomiale logistische Regression
(Dies wurde als spätere Bearbeitung hinzugefügt.)
Nachdem wir den Wert der Verwendung von log Odds zur Darstellung von Chancen erkannt haben, gehen wir zum multinomialen Fall über. Nun kann die abhängige Variable einer von Kategorien entsprechen, indiziert durch . Die relative Wahrscheinlichkeit, dass es in der Kategorie ist, istk ≥ 2 i = 1 , 2 , … , k iY.k ≥ 2i = 1 , 2 , ... , kich
Pr [ Yich] ∼ exp( β( i )1X1+ ⋯ + β( i )mXm)
mit zu bestimmenden Parametern und Schreiben von für . Als Abkürzung schreiben wir den rechten Ausdruck als oder, wenn und aus dem Kontext hervorgehen, einfach als . Das Normalisieren, um alle diese relativen Wahrscheinlichkeiten zur Summe zu machen, ergibt die Einheit Y i Pr [ Y = Kategorie i ] p i ( X , β ) X β p iβ( i )jY.ichPr [ Y= Kategorie i ]pich( X, β)Xβpich
Pr [ Yich] = pich( X, β)p1( X, β) + ⋯ + pm( X, β).
(Die Parameter sind nicht eindeutig: Es gibt zu viele. Normalerweise wählt man eine "Basis" -Kategorie zum Vergleich und zwingt alle ihre Koeffizienten auf Null. Dies ist jedoch erforderlich, um eindeutige Schätzungen der Betas zu melden.) Es ist nicht erforderlich, die Koeffizienten zu interpretieren. Um die Symmetrie beizubehalten, dh künstliche Unterscheidungen zwischen den Kategorien zu vermeiden, sollten wir keine solche Einschränkung erzwingen, es sei denn, wir müssen.)
Eine Möglichkeit zur Interpretation dieses Modells besteht darin, die marginale Änderungsrate der Log-Quoten für eine Kategorie (z. B. Kategorie ) in Bezug auf eine der unabhängigen Variablen (z. B. ) . Das heißt, wenn wir ein wenig ändern, führt dies zu einer Änderung der Log-Quoten von . Wir sind an der Proportionalitätskonstante interessiert, die diese beiden Änderungen miteinander verbindet. Die Kettenregel des Kalküls sagt uns zusammen mit einer kleinen Algebra, dass diese Änderungsrate istX j X j Y iichXjXjY.ich
∂ Log Quoten ( Yich)∂ Xj= β( i )j- β( 1 )jp1+ ⋯ + β( i - 1 )jpi - 1+ β( i + 1 )jpi + 1+ ⋯ + β( k )jpkp1+ ⋯ + pi - 1+ pi + 1+ ⋯ + pk.
Dies hat eine relativ einfache Interpretation als der Koeffizient von in der Formel für die Wahrscheinlichkeit, dass in der Kategorie minus einer "Anpassung" ist. Die Anpassung ist der wahrscheinlichkeitsgewichtete Durchschnitt der Koeffizienten von in allen anderen Kategorien . Die Gewichte werden unter Verwendung von Wahrscheinlichkeiten berechnet, die den aktuellen Werten der unabhängigen Variablen . Daher ist die marginale Änderung der Protokolle nicht unbedingt konstant: Sie hängt von den Wahrscheinlichkeiten aller anderen Kategorien ab, nicht nur von der Wahrscheinlichkeit der betreffenden Kategorie (Kategorie ). X j Y i X j X iβ( i )jXjY.ichXjXich
Wenn es nur Kategorien gibt, sollte sich dies auf eine normale logistische Regression reduzieren. In der Tat hat die Wahrscheinlichkeitsgewichtung keine Auswirkung und (Auswahl von ) ergibt einfach die Differenz . Wenn die Kategorie der Basisfall ist, wird dies weiter auf reduziert , da wir erzwingen . So verallgemeinert die neue Interpretation die alte.i = 2 β ( 2 ) j - β ( 1 ) j i β ( 2 ) j β ( 1 ) j = 0k = 2i = 2β( 2 )j- β( 1 )jichβ( 2 )jβ( 1 )j= 0
Um direkt zu interpretieren , werden wir es auf einer Seite der vorhergehenden Formel isolieren, was zu Folgendem führt:β( i )j
Der Koeffizient der für die Klasse die marginale Veränderung ist gleich in den Log - Odds der Kategorie in Bezug auf die variable , sowie die Wahrscheinlichkeit gewichtete Durchschnitt der Koeffizienten aller anderen für die Klasse . i i X j X j ' iXjichichXjXj′ich
Eine andere Interpretation, wenn auch etwas weniger direkt, ergibt sich, wenn die Kategorie (vorübergehend) als Basisfall festgelegt wird, wodurch für alle unabhängigen Variablen :β ( i ) j = 0 X jichβ( i )j= 0Xj
Die marginale Änderungsrate der logarithmischen Quoten des Basisfalls für die Variable ist das Negative des wahrscheinlichkeitsgewichteten Durchschnitts seiner Koeffizienten für alle anderen Fälle.Xj
Das Verwenden dieser Interpretationen erfordert normalerweise das Extrahieren der Betas und der Wahrscheinlichkeiten aus der Software-Ausgabe und das Ausführen der Berechnungen wie gezeigt.
Schließlich ist für die potenzierten Koeffizienten zu beachten, dass das Verhältnis der Wahrscheinlichkeiten zwischen zwei Ergebnissen (manchmal als das "relative Risiko" von Vergleich zu ) isti 'ichich′
Y.ichY.ich′= pich( X, β)pich′( X, β).
Erhöhen wir um eine Einheit auf . Dies multipliziert mit und mit , wobei das relative Risiko mit multipliziert wird. = . Wird die Kategorie als Basisfall herangezogen, reduziert sich dies auf , was uns dazu veranlasst zu sagen,X j + 1 p iXjXj+ 1piexp(β(i)j)pi′exp(β(i′)j)exp(β(i)j)/exp(β(i′)j)i ' exp ( β ( i ) j )exp(β(i)j−β(i′)j)i′exp(β(i)j)
Der potenzierte Koeffizient ist der Betrag, mit dem das relative Risiko multipliziert wird wenn die Variable um eine Einheit erhöht wird.Pr [ Y = Kategorie i ] / Pr [ Y = Basiskategorie ] X jexp(β(i)j)Pr[Y=category i]/Pr[Y=base category]Xj
Versuchen Sie, diese Erklärung zusätzlich zu dem zu berücksichtigen, was @whuber bereits so gut geschrieben hat. Wenn exp (B) = 6, dann ist das mit einer Zunahme von 1 auf dem fraglichen Prädiktor verbundene Quotenverhältnis 6. In einem multinomialen Kontext meinen wir mit "Quotenverhältnis" das Verhältnis dieser beiden Größen: a) die Quoten ( keine Wahrscheinlichkeit, sondern p / [1-p]) eines Falls, der den Wert der in der fraglichen Ausgabetabelle angegebenen abhängigen Variablen annimmt, und b) die Wahrscheinlichkeit eines Falls, der den Referenzwert der abhängigen Variablen annimmt.
Sie scheinen zu versuchen, die Wahrscheinlichkeit eines Falls in der einen oder der anderen Kategorie zu quantifizieren - und nicht die einer oder anderen. Um dies zu tun, müssten Sie wissen, mit welchen Wahrscheinlichkeiten der Fall "begonnen" hat - dh bevor wir die Erhöhung von 1 für den fraglichen Prädiktor angenommen haben. Die Wahrscheinlichkeitsverhältnisse variieren von Fall zu Fall, während das Verhältnis der Wahrscheinlichkeiten, das mit einer Erhöhung des Prädiktors um 1 verbunden ist, gleich bleibt.
quelle
Ich suchte auch nach der gleichen Antwort, aber die oben genannten waren für mich nicht zufriedenstellend. Es schien zu komplex für das, was es wirklich ist. Also werde ich meine Interpretation geben, bitte korrigiere mich, wenn ich falsch liege.
Lesen Sie jedoch bis zum Ende, da es wichtig ist.
Zuallererst sind die Werte B und Exp (B) die, nach denen Sie suchen. Wenn das B negativ ist, ist Ihre Exp (B) niedriger als eins, was bedeutet, dass die Gewinnchancen sinken. Bei einem höheren Wert ist Exp (B) höher als 1, was bedeutet, dass sich die Gewinnchancen erhöhen. Da multiplizieren Sie mit dem Faktor Exp (B).
Leider bist du noch nicht da. Da Ihre abhängige Variable in einer multinominalen Regression mehrere Kategorien hat, bezeichnen wir diese Kategorien als D1, D2 und D3. Davon ist Ihre letzte die Referenzkategorie. Nehmen wir an, Ihre erste unabhängige Variable ist Geschlecht (Männer gegen Frauen).
Angenommen, die Ausgabe für D1 -> Männer ist exp (B) = 1,21. Dies bedeutet, dass sich die Chancen für Männer um den Faktor 1,21 erhöhen, wenn sie in der Kategorie D1 und nicht in der Kategorie D3 (Referenzkategorie) im Vergleich zu Frauen (Referenzkategorie) liegen.
Sie vergleichen also immer mit Ihrer Referenzkategorie der abhängigen, aber auch der unabhängigen Variablen. Dies gilt nicht, wenn Sie eine kovariate Variable haben. In diesem Fall würde es bedeuten; Eine Erhöhung von X um eine Einheit erhöht die Wahrscheinlichkeit, in der Kategorie D1 statt D3 zu stehen, um den Faktor 1,21.
Für diejenigen mit einer ordinalen abhängigen Variablen:
Wenn Sie eine ordinale abhängige Variable haben und keine ordinale Regression durchgeführt haben, zum Beispiel aufgrund der Annahme proportionaler Quoten. Denken Sie daran, dass Ihre höchste Kategorie die Referenzkategorie ist. Ihr Ergebnis wie oben ist gültig zu melden. Bedenken Sie jedoch, dass eine Erhöhung der Gewinnchancen eine Erhöhung der Gewinnchancen bedeutet, eher in der unteren als in der oberen Kategorie zu sein! Dies ist jedoch nur möglich, wenn Sie eine ordinale abhängige Variable haben.
Wenn Sie den prozentualen Anstieg wissen möchten, nehmen Sie eine fiktive Gewinnchancen-Zahl, sagen wir 100, und multiplizieren Sie sie mit 1,21, was 121 ist. Verglichen mit 100, wie viel hat es sich prozentual verändert?
quelle
Angenommen, exp (b) in einem mlogit ist 1,04. Wenn Sie eine Zahl mit 1,04 multiplizieren, erhöht sich diese um 4%. Das ist das relative Risiko, in der Kategorie a statt b zu sein. Ich vermute, dass ein Teil der Verwirrung hier mit 4% (multiplikative Bedeutung) und 4 Prozentpunkten (additive Bedeutung) zu tun haben könnte. Die prozentuale Interpretation ist korrekt, wenn es sich um eine prozentuale Änderung und nicht um eine prozentuale Punktänderung handelt. (Letzteres wäre ohnehin nicht sinnvoll, da relative Risiken nicht in Prozent ausgedrückt werden.)
quelle