Es gibt einen Absatz über Interaktionen in The Book of Why (Pearl & Mackenzie, 2018), Kapitel 9 (Ich kann die Seitenzahl nicht teilen, weil ich das Buch im Epub-Format habe), in dem die Autoren argumentieren, dass:
Gleichung 9.4 gilt jedoch automatisch in einer Situation, ohne dass offensichtlich Kontrafakten aufgerufen werden müssen. Dies ist der Fall bei einem linearen Kausalmodell, wie wir es in Kapitel 8 gesehen haben. Wie dort erläutert, erlauben lineare Modelle keine Wechselwirkungen , was sowohl eine Tugend als auch ein Nachteil sein kann. Es ist eine Tugend in dem Sinne, dass es die Mediationsanalyse viel einfacher macht, aber es ist ein Nachteil, wenn wir einen realen kausalen Prozess beschreiben wollen, der Interaktionen beinhaltet. [Hervorhebung von mir]
Die Gleichung 9.4 lautet
Sie wiederholten ein ähnliches Argument zuvor in Kapitel 8:
Andererseits können lineare Modelle keine Dosis-Wirkungs-Kurven darstellen, die keine geraden Linien sind. Sie können keine Schwelleneffekte darstellen, wie z. B. ein Medikament, das bis zu einer bestimmten Dosierung zunehmende Wirkungen hat und dann keine weitere Wirkung hat. Sie können auch keine Interaktionen zwischen Variablen darstellen . Beispielsweise kann ein lineares Modell keine Situation beschreiben, in der eine Variable die Wirkung einer anderen Variablen verstärkt oder hemmt. (Zum Beispiel könnte Bildung die Wirkung von Erfahrung verbessern, indem sie den Einzelnen in einen schnelleren Job versetzt, der größere jährliche Erhöhungen erzielt.) [Hervorhebung meiner]
Und in Kapitel 7:
Beachten Sie auch, dass die auf Regression basierende Anpassung * nur für lineare Modelle funktioniert, bei denen eine wichtige Modellannahme erforderlich ist. Bei linearen Modellen verlieren wir die Fähigkeit, nichtlineare Wechselwirkungen zu modellieren, z. B. wenn die Auswirkung von X auf Y von der Ebene von Z abhängt. Die Anpassung der Hintertür funktioniert jedoch auch dann noch einwandfrei, wenn wir keine Ahnung haben, was Funktionen stehen hinter den Pfeilen in den Diagrammen. In diesem sogenannten nichtparametrischen Fall müssen wir jedoch andere Extrapolationsmethoden anwenden, um mit dem Fluch der Dimensionalität umzugehen. [Hervorhebung von mir]
Warum argumentieren Pearl & Mackenzie, dass lineare Modelle keine Interaktionen zulassen? Übersehe ich wichtige Details und kontextspezifische Informationen?
* Durch regressionsbasierte Anpassung beziehen sich die Autoren (in den vorhergehenden Absätzen) auf das, was wir manchmal als "Steuern für" andere Variablen bezeichnen: "Das Analogon einer Regressionslinie ist eine Regressionsebene mit einer Gleichung, die wie aussieht ... Der Koeffizient gibt den Regressionskoeffizienten von auf bereits für angepasst wurde . (Er wird als partieller Regressionskoeffizient bezeichnet und als .) "
Antworten:
Sie verbinden lineare Parameter mit linearen Variablen. Die Linearität bezieht sich hier auf die Beziehung zwischen den Variablen.
Ihr Punkt im Buch ist, dass, wenn das Modell in den Variablen nicht linear ist, auch nicht die Gleichung
hält, noch der Regressionskoeffizient gibt Ihnen die richtige Anpassung der Hintertür direkt.
Berücksichtigen Sie beispielsweise im letzten Fall die bedingte ErwartungE.[ Y.| x,z] = βx + γz , die in Bezug auf linear ist X. und Z. .
WennZ. erfüllt das Backdoor-Kriterium für die kausale Wirkung von X. auf Y. , dann
Das heißt, der Regressionskoeffizientβ entspricht dem durchschnittlichen marginalen kausalen Effekt. Dies ist in diesem Fall unter "Regressionsbasierte Anpassungsarbeiten" zu verstehen. Hier sind keine zusätzlichen Schritte erforderlich. Die gesamte für die Backdoor-Anpassung erforderliche Mittelung erfolgt automatisch durch Regression.
Betrachten Sie nun die bedingte ErwartungE.[ Y.| x,z] = βx + γz+ δ( x × z) . Beachten Sie, dass dies in Bezug auf nicht linear istx und z (obwohl es in den Parametern linear ist).
Beachten Sie in diesem Fall, wennZ. erfüllt das Backdoor-Kriterium für die kausale Wirkung von X. auf Y. , dann
Das heißt, die korrekte Anpassung der Hintertür ist nicht durch den Regressionskoeffizienten gegebenX. nur.
Ganz allgemein sagt Pearl, dass wennZ. Wenn das Backdoor-Kriterium erfüllt ist, können Sie jeden nicht parametrischen Schätzer verwenden, den Sie bevorzugen, um die Verteilung nach dem Eingriff zu berechnen E.[ Y.| do ( x ) ] = E.[ E.[ Y.| x,Z.] ] .
quelle
"Rein lineare" Modelle lassen dies nicht zu. Wenn Sie eine Interaktion anhand eines bestimmten Falls des allgemeinen linearen Modells modellieren möchten (verwechseln Sie dies nicht mit einem verallgemeinerten linearen Modell), müssen Sie eine künstliche zusätzliche Variable wie das Produkt der beiden interagierenden Modelle einführen.
Dieses neue Modell ist in Bezug auf seine Parameter immer noch linear (dies ist wichtig, um die Schätzer zu erhalten), aber es ist in Bezug auf seine Variablen nicht mehr linear (Sie können nicht mehr über eine lineare Beziehung zwischen Regressoren und Ziel sprechen).
quelle