Angenommen, wir haben die ordinale Antwort und eine Menge von Variablen , die wir denken werde erklären . Wir führen dann eine geordnete logistische Regression von (Entwurfsmatrix) auf (Antwort) durch.X : = [ x 1 , x 2 , x 3 ] y X y
Angenommen, der geschätzte Koeffizient von heißt und beträgt in der geordneten logistischen Regression . Wie interpretiere ich das Odds Ratio (OR) von ?β 1 - 0,5 e - 0,5 = 0,607
Muss ich sagen , „für eine 1 Einheit Anstieg der , ceteris paribus, die Chancen zu beobachten sind mal die Chancen zu beobachten , und für die gleiche Änderung in , die Chancen zu beobachten sind mal die Chancen zu beobachten „? Gut 0.607 Bad ∪ Neutral x 1 Neutral ∪ Gut 0.607 Bad
Ich kann in meinem Lehrbuch oder in Google keine Beispiele für die Interpretation negativer Koeffizienten finden.
quelle
Antworten:
Sie sind auf dem richtigen Weg, aber sehen Sie immer in der Dokumentation der von Ihnen verwendeten Software nach, welches Modell tatsächlich passt. Es sei eine Situation mit einer kategorial abhängigen VariablenY. mit geordneten Kategorien 1 , … , g, … , K und Prädiktoren X1, … , Xj, … , Xp .
"In the wild" gibt es drei gleichwertige Möglichkeiten, um das theoretische Proportional-Odds-Modell mit verschiedenen implizierten Parameterbedeutungen zu schreiben:
(Modelle 1 und 2 haben die Einschränkung, dass in den separaten binären logistischen Regressionen die nicht mit variieren und , Modell 3 hat die gleiche Einschränkung für und erfordert, dass )β j g β 0 1 < … < β 0 g < … < β 0 k - 1 β j β 0 2 > … > β 0 g > … > β 0 kk - 1 βj G β01< … < Β0G< … < Β0k- 1 βj β02> … > Β0G> … > Β0k
Unter der Annahme, dass Ihre Software Modell 2 oder 3 verwendet, können Sie bei einer Steigerung von 1 Einheit ceteris paribus die vorhergesagten Wahrscheinlichkeiten für die Beobachtung von ' ' im Vergleich zur Beobachtung von ' ' sagen 'Änderung um einen Faktor von . ", und ebenfalls" mit einer 1- Zunahme von , ceteris paribus, die vorhergesagte Wahrscheinlichkeit,' 'vs. Beobachten einer Änderung von ' 'um den Faktor . " Beachten Sie, dass wir im empirischen Fall nur die vorhergesagten Quoten haben, nicht die tatsächlichen. Y = Gut Y = Nullorbad e β 1 = 0,607 X 1 Y = gut oder Neutral Y = Bad e β 1 = 0,607X1 Y.= Gut Y.= Neutral ODER Schlecht eβ^1=0.607 X1 Y=Good OR Neutral Y=Bad eβ^1=0.607
Hier einige zusätzliche Abbildungen für Modell 1 mit Kategorien. Erstens die Annahme eines linearen Modells für die kumulativen Logs mit proportionalen Quoten. Zweitens die impliziten Wahrscheinlichkeiten, höchstens Kategorie . Die Wahrscheinlichkeiten folgen logistischen Funktionen mit der gleichen Form. gk=4 G
Für die Kategoriewahrscheinlichkeiten selbst impliziert das dargestellte Modell die folgenden geordneten Funktionen:
PS Meines Wissens wird Modell 2 in SPSS sowie in R-Funktionen
MASS::polr()
und verwendetordinal::clm()
. Modell 3 wird in R-Funktionenrms::lrm()
und verwendetVGAM::vglm()
. Leider kenne ich SAS und Stata nicht.quelle
glm(..., family=binomial)