Unerwartete Singularitäten im hessischen Matrixfehler bei der multinomialen logistischen Regression

8

Ich habe mit SPSS 19 eine multinomiale logistische Regressionsanalyse durchgeführt. Beim Ausführen des Analyseverfahrens ist das folgende Problem aufgetreten:

"Unerwartete Singularitäten in der hessischen Matrix treten auf. Dies weist darauf hin, dass entweder einige Prädiktorvariablen ausgeschlossen oder einige Kategorien zusammengeführt werden sollten."

Ein kleiner Hintergrund zu meinen verwendeten Daten. Ich habe vier kategoriale Prädiktoren mit jeweils zwei Ebenen, 1 oder 2. Die Antwortvariable in meinem Modell ist eine kategoriale Variable mit drei Ebenen. Ich habe die letzte Ebene als Referenzkategorie verwendet. Ich habe versucht, die Koeffizienten des Abschnitts mit denen der vier Prädiktoren in den beiden Protokollen zu vergleichen, um herauszufinden, welche Ebene der Antwortvariablen dieses Problem verursachen kann. Die großen Unterschiede in den Koeffizienten zwischen dem Achsenabschnitt und drei der Prädiktoren legen nahe, dass es möglicherweise die Referenzkategorie ist, die das Problem hat. Ich konnte jedoch die Ebenen der Antwortvariablen nicht kombinieren (was für meine Forschung nicht zulässig ist).

Ich habe auch versucht, die Prädiktoren einzeln auszuschließen, habe aber immer noch das gleiche Problem.

Könnte mir bitte jemand sagen, was ich tun soll, um dieses Problem zu lösen?

Kate
quelle
1
Eine erste Überprüfung wäre, den Rang Ihrer Entwurfsmatrix zu berechnen. Wenn es weniger als die Anzahl der Spalten ist, müssen Sie wahrscheinlich entsprechend kombinieren und / oder neu codieren.
Kardinal
Da alle Variablen kategorisch sind, besteht eine alternative Option darin, Kontingenztabellenmethoden zu verwenden. Dh Sie haben eine Fünf-Wege-Kontingenztabelle. Dies kann mit einem Poisson glm (logarithmisch lineares Modell) erfolgen, das möglicherweise stabiler ist (möglicherweise jedoch nicht). Könnte auch ein "Trennungsproblem" sein - Ihre Antwort kann anhand der Kovariaten perfekt vorhergesagt werden - lässt Computer ausflippen, wenn dies geschieht, weil die Varianz Null ist.
Wahrscheinlichkeitslogik
Tatsächlich ist das Kombinieren von Ebenen der Antwortvariablen eine empfohlene Methode, um Probleme bei der multinomialen logistischen Regression anzugehen. Durch Kombinieren der unteren beiden Ebenen und der oberen beiden Ebenen können Sie die multinomialen Ergebnisse mithilfe von zwei (einfacheren) logistischen Regressionen approximieren. Diese logistischen Regressionen und ihre Diagnose können darauf hinweisen, was falsch läuft.
whuber

Antworten:

4

Der Schlüssel, nach dem Sie suchen, finden Sie auf der UCLA-Website für multinomiale logistische Regression. Dort heißt es:

Perfekte Vorhersage: Perfekte Vorhersage bedeutet, dass nur ein Wert einer Prädiktorvariablen nur einem Wert der Antwortvariablen zugeordnet ist. An der Ausgabe der Regressionskoeffizienten können Sie erkennen, dass etwas nicht stimmt. Sie können dann eine Zwei-Wege-Tabelle der Ergebnisvariablen mit der problematischen Variablen erstellen, um dies zu bestätigen, und dann das Modell ohne die problematische Variable erneut ausführen.

Ich würde empfehlen, für jeden der Prädiktoren (im Vergleich zur Antwort) eine Zwei-Wege-Tabelle auszuführen, um festzustellen, ob eine Ebene der Antwort nur mit einer Ebene Ihres Prädiktors auftritt.

M. Tibbits
quelle