Hier ist eine Liste der logistischen Regressionskoeffizienten (der erste ist ein Achsenabschnitt)
-1059.61966694592
-1.23890500515482
-8.57185269220438
-7.50413155570413
0
1.03152408392552
1.19874787949191
-4.88083274930613
-5.77172565873336
-1.00610998453393
Ich finde es seltsam, wie niedrig der Achsenabschnitt ist und ich einen Koeffizienten habe, der eigentlich gleich 0 ist. Ich bin mir nicht ganz sicher, wie ich das interpretieren würde. Bedeutet die 0, dass die spezifische Variable überhaupt keine Auswirkung auf das Modell hat? Aber das Abfangen, das durch die Eingabe einer eigenen Spalte gemacht wird, ist plötzlich wirklich wichtig? Oder sind meine Daten nur Mist und das Modell kann nicht richtig passen.
regression
logistic
shiu6rewgu
quelle
quelle
Antworten:
Was den Koeffizienten 0 betrifft, bedeutet dies, dass diese Variable keine Auswirkung hat, wie Sie vorschlagen. Nun ist es ziemlich vernünftig, dass eine Variable keinen Effekt hat. Trotzdem erhalten Sie im Grunde nie einen Koeffizienten von genau 0. Ich weiß nicht, warum er in diesem Fall auftrat. Die Kommentare bieten einige mögliche Vorschläge. Ich kann eine andere anbieten, nämlich, dass diese Variable möglicherweise nicht variiert. Zum Beispiel, wenn Sie eine Variable hatten, die für Sex codiert, aber nur Frauen in Ihrer Stichprobe. Ich weiß nicht, ob das die richtige Antwort ist (R gibt
NA
in diesem Fall beispielsweise zurück , aber die Software unterscheidet sich) - es ist nur ein weiterer Vorschlag.quelle
Interpretation des Abschnitts
Sie können sich eine logistische Regression vorstellen, die Ihnen eine hintere Wahrscheinlichkeit gibt, eine „1“ zu sein. Der Achsenabschnitt stellt eine Priorisierung von Kategorien dar, die aus dem Datensatz abgeleitet wurden: Insbesondere handelt es sich um die empirische Schätzung von log (p (Y = 1) / p (Y = 0) für sich, wenn das Modell nur einen Achsenabschnitt für die Fälle in hat Die Referenzklassen, wenn es kategoriale Kovariaten gibt, und für Fälle, in denen die Kovariaten allgemeiner (aber weniger interpretierbar) bei 0 sind mit allen Kovariaten bei 0. Auch hier kann es dort keine Beobachtungen, so ist es nicht wert , sich Gedanken über die Intercept - Wert ist. Diese Diskussion ziemlich klar.
Aufgrund dieser praktischen Trennung der Bedenken zwischen den Parametern können Sie das Ungleichgewicht der Kategorien korrigieren, indem Sie an einer besser ausbalancierten Stichprobe trainieren und nur den Achsenabschnitt anpassen . Siehe King und Zeng für eine gründliche Diskussion.
quelle