Multinomiale logistische Regressionsannahmen

Antworten:

6

Die Hauptannahme in der MNL ist, dass die Fehler unabhängig und identisch mit einer Gumbel-Extremwertverteilung verteilt sind. Das Problem beim Testen dieser Annahme ist, dass sie a priori gemacht wird . In der Standardregression passen Sie die Kurve der kleinsten Quadrate an und messen den Restfehler. In einem Logit-Modell nehmen Sie an, dass der Fehler bereits in der Messung des Punkts liegt, und berechnen aus dieser Annahme eine Wahrscheinlichkeitsfunktion.

Eine wichtige Annahme ist, dass die Probe exogen ist. Wenn es wahlbasiert ist, müssen Korrekturen vorgenommen werden.

In Bezug auf die Annahmen zum Modell selbst beschreibt Train drei:

  1. Systematische und nicht zufällige Geschmacksvariationen.
  2. Proportionale Substitution zwischen Alternativen (eine Folge der IIA-Eigenschaft).
  3. Keine serielle Korrelation im Fehlerterm (Paneldaten).

Die erste Annahme müssen Sie meist nur im Kontext Ihres Problems verteidigen. Der dritte ist weitgehend der gleiche, da die Fehlerterme rein zufällig sind.

λ=1λ=1 konsistent erhalten.

Soweit dies in SPSS möglich ist, kann ich Ihnen nur empfehlen, das mlogitPaket in R zu verwenden. Es tut uns leid.

Gregmacfarlane
quelle
Das multinomiale Probit-Modell liefert auch eine vergleichbare Ausgabe mit unterschiedlichen Annahmen. Ein MNP / MNL-Vergleich kann also ebenfalls wertvoll sein.
Gregmacfarlane
3

Y

Frank Harrell
quelle
Es stellt sich heraus, dass dies nicht immer ganz richtig ist. Es gibt einige (sehr) kürzlich durchgeführte Arbeiten, die zeigen, dass konsistente Parameter für Alternativen geschätzt werden können, die Sie nie beobachten, vorausgesetzt, Sie haben einige exogene Informationen über die tatsächliche Bevölkerungshäufigkeit. Dies erfordert jedoch einen anderen Schätzer, sodass Sie im Allgemeinen richtig liegen.
Gregmacfarlane
1
Klingt so, als ob ein Bayes'scher Prior verlangt wird - kann nicht widersprechen. Aber ohne externe Informationen hat die uneingeschränkte multinomiale Logistik eine Menge zu schätzender Parameter.
Frank Harrell
2

gmacfarlane war sehr klar. Genauer gesagt, und ich gehe davon aus, dass Sie eine Querschnittsanalyse durchführen, ist die Kernannahme die IIA (Unabhängigkeit von irrelevanten Alternativen). Sie können nicht erzwingen, dass Ihre Daten in die IIA-Annahme passen. Sie sollten sie testen und hoffen, dass sie erfüllt werden. Spss konnte den Test mit Sicherheit erst 2010 durchführen. R tut es natürlich, aber es könnte für Sie einfacher sein, zu stata zu migrieren und die IIA-Tests zu implementieren, die von den mlogit-Postestimationsbefehlen bereitgestellt werden.

Wenn die IIA nicht gilt, sind gemischte multinomiale oder verschachtelte Protokolle sinnvolle Alternativen. Der erste kann innerhalb des Gllamms geschätzt werden, der zweite mit dem weitaus sparsameren Befehl nlogit.

JDav
quelle