Vorstellen
- Sie führen eine lineare Regression mit vier numerischen Prädiktoren aus (IV1, ..., IV4).
- Wenn nur IV1 als Prädiktor enthalten ist, lautet die standardisierte Beta
+.20
- Wenn Sie auch IV2 bis IV4 einschließen, wird das Vorzeichen des standardisierten Regressionskoeffizienten von IV1 umgekehrt
-.25
(dh es wird negativ).
Dies wirft einige Fragen auf:
- Nennen Sie dies terminologisch einen "Suppressor-Effekt"?
- Welche Strategien würden Sie anwenden, um diesen Effekt zu erklären und zu verstehen?
- Haben Sie Beispiele für solche Effekte in der Praxis und wie haben Sie diese erklärt und verstanden?
regression
predictor
Jeromy Anglim
quelle
quelle
Antworten:
Multikollinearität ist der übliche Verdächtige, wie JoFrhwld erwähnte. Wenn Ihre Variablen positiv korreliert sind, werden die Koeffizienten grundsätzlich negativ korreliert, was zu einem falschen Vorzeichen bei einem der Koeffizienten führen kann.
Eine Überprüfung wäre, eine Hauptkomponenten- oder Kammregression durchzuführen. Dies reduziert die Dimensionalität des Regressionsraums und behandelt die Multikollinearität. Sie erhalten voreingenommene Schätzungen, aber möglicherweise niedrigere MSE und korrigierte Vorzeichen. Unabhängig davon, ob Sie mit diesen bestimmten Ergebnissen zufrieden sind oder nicht, ist dies eine gute diagnostische Überprüfung. Wenn Sie immer noch Vorzeichenwechsel erhalten, kann es theoretisch interessant sein.
AKTUALISIEREN
Nach dem Kommentar in John Christies Antwort könnte dies interessant sein. Assoziationsumkehr (Größe oder Richtung) sind Beispiele für Simpsons Paradoxon, Lords Paradoxon und Unterdrückungseffekte. Die Unterschiede beziehen sich im Wesentlichen auf die Art der Variablen. Es ist sinnvoller, das zugrunde liegende Phänomen zu verstehen, als an ein bestimmtes "Paradoxon" oder einen bestimmten Effekt zu denken. Für eine kausale Perspektive ist das folgende Papier eine gute Erklärung, und ich werde ausführlich ihre Einführung und Schlussfolgerung zitieren, um Ihren Appetit anzuregen.
quelle
Ich glaube, dass solche Effekte häufig durch Kollinearität verursacht werden (siehe diese Frage ). Ich denke, das Buch über Mehrebenenmodellierung von Gelman und Hill spricht darüber. Das Problem ist , dass
IV1
mit einer oder mehreren der anderen Prädiktoren korreliert, und wenn sie alle in dem Modell enthalten sind, deren Schätzung wird unberechenbar.Wenn das Umkehren des Koeffizienten auf Kollinearität zurückzuführen ist, ist es nicht wirklich interessant zu berichten, da dies nicht auf die Beziehung zwischen Ihren Prädiktoren zum Ergebnis zurückzuführen ist, sondern auf die Beziehung zwischen Prädiktoren.
Was ich gesehen habe, um dieses Problem zu lösen, ist die Residualisierung. Zuerst passen Sie ein Modell für an
IV2 ~ IV1
und nehmen dann die Residuen dieses Modells alsrIV2
. Wenn alle Variablen korreliert sind, sollten Sie sie wirklich alle restrukturieren. Sie können tun, um dies zu tunNun passen Sie das endgültige Modell mit an
Der Koeffizient für
rIV2
stellt nun den unabhängigen Effekt darIV2
, dessen Korrelation mit gegeben istIV1
. Ich habe gehört, dass Sie nicht das gleiche Ergebnis erzielen, wenn Sie in einer anderen Reihenfolge residenzieren, und dass die Auswahl der Residenzierungsreihenfolge in Ihrer Forschung wirklich ein entscheidender Faktor ist.quelle
O
, und Ihre Prädiktoren sindIncome
undFather's Income
. Die Tatsache, dieIncome
damit korreliertFather's Income
ist, ist von Natur aus interessant, aber diese Tatsache wäre wahr, egal von welchem WertO
. Das heißt, Sie könnten feststellen, dassO
die Prädiktoren alle kollinear sind, ohne jemals Ihre Ergebnisdaten zu erfassen oder sogar zu wissen, was das Ergebnis ist! Diese Fakten sollten nicht besonders interessant werden, wenn Sie erst einmal wissen, dass diesO
wirklich der Fall istEducation
.Siehe Simpsons Paradoxon . Kurz gesagt, der beobachtete Haupteffekt kann sich umkehren, wenn einem Modell eine Interaktion hinzugefügt wird. Auf der verlinkten Seite sind die meisten Beispiele kategorisch, aber es gibt eine Abbildung oben auf der Seite, die man sich ununterbrochen vorstellen kann. Wenn Sie beispielsweise einen kategorialen und kontinuierlichen Prädiktor haben, kann der kontinuierliche Prädiktor das Vorzeichen leicht umdrehen, wenn der kategoriale hinzugefügt wird und innerhalb jeder Kategorie das Vorzeichen anders ist als für die Gesamtpunktzahl.
quelle