Logistische Regression und ordinale unabhängige Variablen

10

Ich habe diesen Beitrag gefunden:

Ja. Der Koeffizient spiegelt die Änderung der logarithmischen Quoten für jedes Inkrement der Änderung des ordinalen Prädiktors wider. Diese (sehr häufige) Modellspezifikation geht davon aus, dass der Prädiktor über seine Inkremente einen linearen Einfluss hat. Um die Annahme zu testen, können Sie ein Modell, in dem Sie die Ordnungsvariable als einzelnen Prädiktor verwenden, mit einem Modell vergleichen, in dem Sie die Antworten diskretisieren und als mehrere Prädiktoren behandeln (wie wenn die Variable nominal wäre). Wenn das letztere Modell nicht zu einer wesentlich besseren Anpassung führt, ist es sinnvoll, jedes Inkrement als linear zu behandeln.

- @ dmk38 12. Dezember 10 um 5:21

Könnten Sie mir bitte sagen, wo etwas veröffentlichtes zu finden ist, das diese Behauptung stützt? Ich arbeite mit Daten und möchte ordinale unabhängige Variablen in der logistischen Regression verwenden.

Frederico
quelle
Siehe eine ähnliche Frage stats.stackexchange.com/q/195246/3277
ttnphns

Antworten:

2

Wie @ Scortchi bemerkt , können Sie auch orthogonale Polynome verwenden. Hier ist eine kurze Demonstration in R:

set.seed(3406)
N      = 50
real.x = runif(N, 0, 10)
ord.x  = cut(real.x, breaks=c(0,2,4,6,8,10), labels=FALSE)
ord.x  = factor(ord.x, levels=1:5, ordered=TRUE)
lo.lin = -3 + .5*real.x
p.lin  = exp(lo.lin)/(1 + exp(lo.lin))
y.lin  = rbinom(N, 1, prob=p.lin)

mod.lin = glm(y.lin~ord.x, family=binomial)
summary(mod.lin)
# ...
# Coefficients:
#             Estimate Std. Error z value Pr(>|z|)   
# (Intercept)  0.05754    0.36635   0.157  0.87520   
# ord.x.L      2.94083    0.90304   3.257  0.00113 **
# ord.x.Q      0.94049    0.85724   1.097  0.27260   
# ord.x.C     -0.67049    0.77171  -0.869  0.38494   
# ord.x^4     -0.09155    0.73376  -0.125  0.90071   
# ...
gung - Monica wieder einsetzen
quelle
8

Jedes gute Buch über logistische Regression wird dies haben, wenn auch vielleicht nicht genau in diesen Worten. Versuchen Sie Agrestis kategoriale Datenanalyse für eine sehr maßgebliche Quelle.

Es folgt auch aus der Definition der logistischen Regression (oder anderer Regressionen). Es gibt nur wenige Methoden, die explizit für ordinale unabhängige Variablen gelten. Die üblichen Optionen sind die Behandlung als kategorisch (wodurch die Reihenfolge verloren geht) oder als fortlaufend (wodurch die in Ihrem Zitat angegebene Annahme getroffen wird). Wenn Sie es als kontinuierlich behandeln, weiß das Programm, das die Analyse durchführt, nicht, dass es ordinal ist. Angenommen, Ihre IV lautet: "Wie sehr mögen Sie Präsident Obama?" und Ihre Antwortmöglichkeiten sind eine Likert-Skala von 1. "Sehr viel" bis 5. "Überhaupt nicht". Wenn Sie dies als fortlaufend behandeln, ist (aus Sicht des Programms) eine "5" -Antwort 5-mal eine "1" -Antwort. Dies kann unangemessen sein oder auch nicht.

Peter Flom - Monica wieder einsetzen
quelle
3
Abschnitt 5.4.6. Und Sie können die Idee mithilfe orthogonaler Polynome erweitern, um den Ordnungsprädiktor zu codieren.
Scortchi - Monica wieder einsetzen
Vielen Dank für Ihre Kommentare, sie werden mir bei meiner Analyse sehr helfen.
Frederico
2
@Frederico, wenn Peters Antwort Ihre Frage gelöst hat, sollten Sie sie akzeptieren, indem Sie auf das Häkchen unter der Stimmensumme links klicken.
Gung - Reinstate Monica