Ich versuche, ein Modell der Berufswahl mit drei Wahlmöglichkeiten abzuschätzen. Gibt es Alternativen zur Verwendung der multinomialen logistischen Regression beim Umgang mit solchen ungeordneten kategorialen Ergebnissen?
Beim Umgang mit binär abhängigen Variablen scheint es mehrere Möglichkeiten zu geben, wie das LPM-Modell sowie das binäre Probit- und Logit-Modell. Beim Umgang mit ungeordneten kategorialen Variablen wird in der Literatur jedoch weiterhin das multinomiale Logit-Modell empfohlen, ohne es mit Alternativen zu vergleichen.
Antworten:
Für die Modellierung multinomialer Modelle stehen verschiedene Modelle zur Verfügung.
Ich empfehle Cameron & Trivedi Microeconometrics Using Stata für eine einfache und hervorragende Einführung oder werfen Sie einen Blick auf die Imbens & Wooldridge Lecture Slides oder hier, die online verfügbar sind.
Zu den weit verbreiteten Modellen gehören:
multinomiale logistische Regression oder mlogit in Stata
multinomiales bedingtes Logit (ermöglicht die einfache Einbeziehung nicht nur individueller, sondern auch wahlspezifischer Prädiktoren) oder Asclogit in Stata
verschachteltes Logit (Lockerung der Unabhängigkeit von der Annahme irrelevanter Alternativen (IIA) durch hierarchische Gruppierung / Rangfolge) oder nlogit in Stata
Mixed Logit (lockert die IIA-Annahme, indem z. B. normalverteilte Parameter angenommen werden) oder Mixlogit in Stata.
Multinomiales Probit-Modell (kann die IIA-Annahme weiter lockern, aber Sie sollten wahlspezifische Prädiktoren zur Verfügung haben) Mixed Logit (lockert die IIA-Annahme unter der Annahme, dass z. B. normalverteilte Parameter vorliegen ), verwenden Sie asmprobit in Stata (mprobit erlaubt jedoch keine wahlspezifischen Prädiktoren, aber Sie sollten sie verwenden , um die IIA Asumption zu entspannen )
quelle
Wenn Sie Optionen wünschen, die sich von einer logistischen Regression deutlich unterscheiden, können Sie ein neuronales Netz verwenden. Zum Beispiel hat das
nnet
Paket von R einemultinom
Funktion. Oder Sie könnten einen zufälligen Wald verwenden (RsrandomForest
Paket und andere). Und es gibt mehrere andere Alternativen für maschinelles Lernen, obwohl Optionen wie eine SVM in der Regel nicht gut kalibriert sind, wodurch ihre Ergebnisse meiner Meinung nach einer logistischen Regression unterlegen sind.[Tatsächlich wird wahrscheinlich ein Logit unter der Haube von den Neuronen im neuronalen Netz verwendet. Es ist also ganz anders, aber nicht ganz anders zur gleichen Zeit.]
quelle
Denken Sie auch, dass für neuronale Netze (mit Softmax-Aktivierung), Entscheidungsbäume (oder zufällige Wälder) die IIA-Annahme nicht erfüllt sein muss, da diese Tests zur Überprüfung der IIA-Annahme unzuverlässig sind. Dies könnte also ein Vorteil gegenüber der multinomialen Logistik sein, wenn es nur um Vorhersagen geht.
Alternativ können mehrere Logistikmodelle für die K-1-Kategorien mit der K-ten Kategorie als Referenz erstellt werden. Dies ermöglicht auch das Einstecken verschiedener Prädiktoren für jede der Gleichungen im Gegensatz zum Multinom
quelle