Was ist der Unterschied zwischen multinomialer und ordinaler logistischer Regression?

Antworten:

13

Im Fall des Multinomials hat man keine intrinsische Ordnung; Im Gegensatz dazu besteht bei der ordinalen Regression eine Assoziation zwischen den Ebenen. Zum Beispiel , wenn Sie die Variable untersuchen , die hat , und als unabhängige Ebenen dann codiert eine multinomial Variable. Wenn Sie eine neue Variable die die Ebenen sind und eine erhöhte Dringlichkeit darstellen, definieren sie eine Ordnungsvariable.V1greenyellowredV1V2greenyellowred

Wie würden diese Variablen codiert:

Bei einer multinomialen Variablen wird diese Variable als Indikatormatrix codiert. Die beliebige Codierung für greenkann [1 0 0], yellowkann [0 1 0]und [0 0 1]für rot sein. Bei einer Ordnungsvariablen ist die Codierung etwas anders. Wenn Sie sich in der yellowStufe befinden, wird davon ausgegangen, dass Sie die greenStufe erreicht und überschritten haben. Ebenso, wenn Sie in der redEbene sind, haben Sie die greenund die yellowEbene erreicht und jetzt sind Sie in der redEbene. Daher ist die Codierung für den greenWert so etwas wie [1 0 0]. Für die yellow, [1 1 0]und red, [1 1 1].

Für das multinomiale mit 7 Samples würde es also ungefähr so ​​aussehen:V1

V1=(001001010100100100010)

während die Ordnungszahl mit 7 Abtastwerten ungefähr so ​​aussehen würde:V2

V2=(111111110100100100110)

Beachten Sie, dass Sie in beiden Fällen dieselben Informationen codieren. Das heißt red, red, yellow, green, green, green, yellow. Wie Sie sehen, ist der Unterschied zwischen der Variablen und jetzt offensichtlich. Wenn Sie versuchen, ein Modell in dieses Modell mit ziemlicher Sicherheit nicht optimal, um vorherzusagen . Die Schätzverfahren für diese Modelle unterscheiden sich tatsächlich nicht wesentlich. Ohne ins Detail zu gehen, verlassen sich beide auf die numerische Optimierung, bei der das sogenannte Fisher-Scoring häufig verwendet wird.V1V2V1V2

Schauen wir uns ein aktuelles Beispiel mit R an. Wir definieren eine multinomiale Variable V1und definieren damit die Ordnungsvariable V2. Getreu einer realen Umgebung haben wir nur irrelevante Informationen, die in verschlüsselt sind GarbageInfo. (Ich verwende die Funktion multinomaus dem nnetPaket, um das Multinomial anzupassen, und die Funktion polraus dem MASSPaket, um das bestellte Protokoll anzupassen. Weitere Informationen erhalten Sie direkt aus der Dokumentation dieser Funktionen.)

set.seed(1234);
N = 100;
V1 = sample(c('green','yellow','red'), N, replace = TRUE)
V2 = ordered(V1, c('green', 'yellow', 'red'))
GarbageInfo = runif(N); # This is used only for illustration purposes
m1 = nnet::multinom(V1 ~ GarbageInfo)
m2 = MASS::polr(V2 ~ GarbageInfo)

Wir überprüfen dann die Modellzusammenfassungen und stellen fest, dass sie sehr interessant sind.

> summary(m1)
Call: nnet::multinom(formula = V1 ~ GarbageInfo)

Coefficients:
       (Intercept) GarbageInfo
red     -0.6011338  -0.1331142
yellow  -0.3221203  -0.5995860

Std. Errors:
       (Intercept) GarbageInfo
red      0.5164521   0.8448432
yellow   0.4932972   0.8380932
...


> summary(m2)
...
Call: MASS::polr(formula = V2 ~ GarbageInfo)

Coefficients:
              Value Std. Error t value
GarbageInfo -0.2181     0.6431 -0.3391

Intercepts:
             Value   Std. Error t value
green|yellow -0.1541  0.3910    -0.3941
yellow|red    0.9856  0.4045     2.4364
...

Während im Fall m1Ihrer Intercept für definiert ist redund yellowgegen die greenBasislinie, die Abschnitte für m2den angegebenen Bedeutungen green|yellowund yellow|red, dh. Sie sind eher Schnittpunkte als einfache Abschnitte. Weiterhin Ihre GarbageInfovariablen Koeffizienten ist üblich inm2im gesamten Modell im Fall der ordinalen Regression, anstatt im Fall des Multinomials für jede Ebene unabhängig geschätzt zu werden. Dies liegt daran, dass Sie die Tatsache ausnutzen, dass Ihre Daten mehr Informationen enthalten und (in diesem Fall) Sie einen zusätzlichen Freiheitsgrad haben. Dies bringt uns zurück zum ersten Satz dieses Beitrags: Multinomiale und ordinale Variablen (und ihre jeweiligen) Regressionsverfahren sind unterschiedlich, weil sie unterschiedliche Informationen codieren.

usεr11852
quelle