Ich habe eine Frage zu ausgelassenen variablen Verzerrungen in der logistischen und linearen Regression.
Angenommen, ich lasse einige Variablen aus einem linearen Regressionsmodell weg. Stellen Sie sich vor, dass diese ausgelassenen Variablen nicht mit den in meinem Modell enthaltenen Variablen korreliert sind. Diese ausgelassenen Variablen beeinflussen die Koeffizienten in meinem Modell nicht.
Aber in der logistischen Regression habe ich gerade gelernt, dass das nicht stimmt. Durch ausgelassene Variablen werden die Koeffizienten auf eingeschlossene Variablen verschoben, auch wenn die ausgelassenen Variablen nicht mit den eingeschlossenen Variablen korreliert sind. Ich habe eine Arbeit zu diesem Thema gefunden, aber ich kann weder Kopf noch Zahl daraus machen.
Hier ist das Papier und einige Powerpoint-Folien.
Die Tendenz ist anscheinend immer gegen Null. Kann mir jemand erklären, wie das geht?
quelle
Antworten:
Der Fall des "Attenuation Bias" kann klarer dargestellt werden, wenn wir das "Probit" -Modell untersuchen - aber das Ergebnis überträgt sich auch auf die logistische Regression.
Unter den bedingten Wahrscheinlichkeitsmodellen (logistische (logit), "probit" und "lineare Wahrscheinlichkeits" Modelle) können wir ein latentes (nicht beobachtbares) lineares Regressionsmodell postulieren :
aufgrund der Schließung unter Hinzufügung der Normalverteilung (und der Annahme der Unabhängigkeit). Anwenden der gleichen Logik wie zuvor, hier haben wir
Das ist das "Bias gegen Null" -Ergebnis.
quelle