Ich habe diese ordinale logistische Regression in R ausgeführt:
mtcars_ordinal <- polr(as.factor(carb) ~ mpg, mtcars)
Ich habe diese Zusammenfassung des Modells erhalten:
summary(mtcars_ordinal)
Re-fitting to get Hessian
Call:
polr(formula = as.factor(carb) ~ mpg, data = mtcars)
Coefficients:
Value Std. Error t value
mpg -0.2335 0.06855 -3.406
Intercepts:
Value Std. Error t value
1|2 -6.4706 1.6443 -3.9352
2|3 -4.4158 1.3634 -3.2388
3|4 -3.8508 1.3087 -2.9425
4|6 -1.2829 1.3254 -0.9679
6|8 -0.5544 1.5018 -0.3692
Residual Deviance: 81.36633
AIC: 93.36633
Ich kann die Log-Quoten des Koeffizienten folgendermaßen mpg
abrufen:
exp(coef(mtcars_ordinal))
mpg
0.7917679
Und die log Quoten der Schwellen wie:
exp(mtcars_ordinal$zeta)
1|2 2|3 3|4 4|6 6|8
0.001548286 0.012084834 0.021262900 0.277242397 0.574406353
Könnte mir jemand sagen, ob meine Interpretation dieses Modells korrekt ist:
Mit
mpg
zunehmendercarb
Anzahl von Einheiten verringert sich die Wahrscheinlichkeit, von Kategorie 1 in eine der anderen 5 Kategorien zu wechseln, um -0,23. Wenn die Log-Quote den Schwellenwert von 0,0015 überschreitet, ist der vorhergesagte Wert für ein Auto Kategorie 2 voncarb
. Wenn die Log-Quote den Schwellenwert von 0,0121 überschreitet, ist der vorhergesagte Wert für ein Auto Kategorie 3 voncarb
usw.
quelle
mpg
polr
definiert als das Modelllogit P(Y <= k | x) = zeta_k - eta
, sollte @ sTask Interpretation nicht lesen, „Wiempg
erhöht sich um eine Einheit, die Chancen der Beobachtung der Kategorie 1 von imcarb
Vergleich zu anderen 5 Kategorien erhöhen , indem 26% (exp(-(-0.2335)) = 1.26
).“In dem geordneten Logit - Modell bilden die Quoten das Verhältnis der Wahrscheinlichkeit in einer Kategorie unter einem bestimmten Schwellenwert zu der Wahrscheinlichkeit in einer Kategorie über demselben Schwellenwert (z. B. mit drei Kategorien: Wahrscheinlichkeit, in Kategorie A oder B zu sein, vs C, sowie die Wahrscheinlichkeit, in Kategorie A gegen B oder C) zu sein.
Dies führt zu dem Modell,
logit P(Y <= k | x) = zeta_k - eta
wie in der Beschreibung von angegebenpolr()
. Daher können Quotenverhältnisse entweder für verschiedene Kategorien oder für verschiedene Regressoren erstellt werden. Letzteres, das häufigere, vergleicht die Quoten für die gleichen Kategorien, aber für unterschiedliche Regressoren und GleichgestellteDas Quotenverhältnis für verschiedene Kategorien ist definiert als
wobei das Verhältnis unabhängig von den Regressoren ist. Diese Eigenschaft führt zu dem alternativen namensproportionalen Gewinnchancenmodell.
In diesem einfachen, aber vielleicht nicht sehr intuitiven Beispiel könnten Sie formulieren: Für eine Erhöhung des Regressors um eine Einheit
mpg
die Wahrscheinlichkeit, Kategorie 1 zu beobachten, im Vergleich zu einer höheren Kategorie (oder die Wahrscheinlichkeit, eine Kategorie unter einem bestimmten Schwellenwert zu beobachten, im Vergleich zu einer höheren Kategorie). Betrachtet man eine Kategorie oberhalb derselben Schwelle, wird diese mit 1,26 multipliziert oder um 26% erhöht (exp(-(-0.233 - 0)) = 1.263
). Wenn Sie ein Quotenverhältnis für verschiedene Kategorien formulieren möchten, können Sie z. B. sagen, dass die Wahrscheinlichkeit, in der Kategorie 1 zu sein, gegenüber einer der oben genannten Kategorien im Vergleich zu der Wahrscheinlichkeit, in der Kategorie 1 oder 2 zu sein, gegenüber einer der oben genannten Kategorien gleich istexp((-6.470) - (-4.415)) = 0.128
. Wobei die letztere Interpretation in diesem speziellen Setup nicht sehr hilfreich ist. Ein Beispiel für ein Quotenverhältnis für verschiedene Kategorien könnte die Wahrscheinlichkeit sein, ein College zu besuchen, verglichen mit der Wahrscheinlichkeit, ein Gymnasium zu besuchen.quelle