Nehmen wir an, wir haben eine abhängige Variable mit wenigen Kategorien und einer Menge unabhängiger Variablen.
Was sind die Vorteile einer multinomialen logistischen Regression gegenüber einer Reihe von binären logistischen Regressionen (dh einem Ein-gegen-Rest-Schema )? Mit binärer logistischer Regression meine ich, dass wir für jede Kategorie ein separates binäres logistisches Regressionsmodell mit target = 1 erstellen, wenn und andernfalls 0.
logistic
categorical-data
multinomial
Tomek Tarczynski
quelle
quelle
Antworten:
Wenn mehr als zwei Kategorien hat, ist Ihre Frage nach dem "Vorteil" einer Regression gegenüber der anderen wahrscheinlich bedeutungslos, wenn Sie die Parameter der Modelle vergleichen möchten , da sich die Modelle grundlegend unterscheiden:Y
Allerdings, wenn Ihr Ziel ist nur Wahrscheinlichkeit vorherzusagen jede Kategorie entweder Ansatz ist gerechtfertigt, wenn auch sie unterschiedliche Wahrscheinlichkeitsschätzungen geben können. Die Formel zum Schätzen einer Wahrscheinlichkeit ist generisch:i
Ein eigenes Thema ist , was technische Unterschiede zwischen multinomial und binären logistischen Regressionen in Fall sind , wenn ist dichotomous . Wird es Unterschiede bei den Ergebnissen geben? Meistens sind die Ergebnisse ohne Kovariaten gleich, es gibt jedoch Unterschiede in den Algorithmen und in den Ausgabeoptionen. Lassen Sie mich nur die SPSS-Hilfe zu diesem Problem in SPSS zitieren:Y
quelle
Aufgrund des Titels gehe ich davon aus, dass "Vorteile der multiplen logistischen Regression" "multinomiale Regression" bedeuten. Es gibt oft Vorteile, wenn das Modell gleichzeitig angepasst wird. Diese besondere Situation wird in Agresti (Categorical Data Analysis, 2002) S. 273 beschrieben. In Summe (Agresti paraphrasieren) erwarten Sie, dass sich die Schätzungen von einem gemeinsamen Modell von einem geschichteten Modell unterscheiden. Die einzelnen Logistikmodelle weisen tendenziell größere Standardfehler auf, obwohl dies möglicherweise nicht so schlimm ist, wenn das häufigste Ergebnisniveau als Referenzniveau festgelegt wird.
quelle