Argument zu Interaktionen im Buch des Warum

7

Es gibt einen Absatz über Interaktionen in The Book of Why (Pearl & Mackenzie, 2018), Kapitel 9 (Ich kann die Seitenzahl nicht teilen, weil ich das Buch im Epub-Format habe), in dem die Autoren argumentieren, dass:

Gleichung 9.4 gilt jedoch automatisch in einer Situation, ohne dass offensichtlich Kontrafakten aufgerufen werden müssen. Dies ist der Fall bei einem linearen Kausalmodell, wie wir es in Kapitel 8 gesehen haben. Wie dort erläutert, erlauben lineare Modelle keine Wechselwirkungen , was sowohl eine Tugend als auch ein Nachteil sein kann. Es ist eine Tugend in dem Sinne, dass es die Mediationsanalyse viel einfacher macht, aber es ist ein Nachteil, wenn wir einen realen kausalen Prozess beschreiben wollen, der Interaktionen beinhaltet. [Hervorhebung von mir]

Die Gleichung 9.4 lautet

Gesamteffekt = Direkter Effekt + Indirekter Effekt

Sie wiederholten ein ähnliches Argument zuvor in Kapitel 8:

Andererseits können lineare Modelle keine Dosis-Wirkungs-Kurven darstellen, die keine geraden Linien sind. Sie können keine Schwelleneffekte darstellen, wie z. B. ein Medikament, das bis zu einer bestimmten Dosierung zunehmende Wirkungen hat und dann keine weitere Wirkung hat. Sie können auch keine Interaktionen zwischen Variablen darstellen . Beispielsweise kann ein lineares Modell keine Situation beschreiben, in der eine Variable die Wirkung einer anderen Variablen verstärkt oder hemmt. (Zum Beispiel könnte Bildung die Wirkung von Erfahrung verbessern, indem sie den Einzelnen in einen schnelleren Job versetzt, der größere jährliche Erhöhungen erzielt.) [Hervorhebung meiner]

Und in Kapitel 7:

Beachten Sie auch, dass die auf Regression basierende Anpassung * nur für lineare Modelle funktioniert, bei denen eine wichtige Modellannahme erforderlich ist. Bei linearen Modellen verlieren wir die Fähigkeit, nichtlineare Wechselwirkungen zu modellieren, z. B. wenn die Auswirkung von X auf Y von der Ebene von Z abhängt. Die Anpassung der Hintertür funktioniert jedoch auch dann noch einwandfrei, wenn wir keine Ahnung haben, was Funktionen stehen hinter den Pfeilen in den Diagrammen. In diesem sogenannten nichtparametrischen Fall müssen wir jedoch andere Extrapolationsmethoden anwenden, um mit dem Fluch der Dimensionalität umzugehen. [Hervorhebung von mir]

Warum argumentieren Pearl & Mackenzie, dass lineare Modelle keine Interaktionen zulassen? Übersehe ich wichtige Details und kontextspezifische Informationen?


* Durch regressionsbasierte Anpassung beziehen sich die Autoren (in den vorhergehenden Absätzen) auf das, was wir manchmal als "Steuern für" andere Variablen bezeichnen: "Das Analogon einer Regressionslinie ist eine Regressionsebene mit einer Gleichung, die wie aussieht ... Der Koeffizient gibt den Regressionskoeffizienten von auf bereits für angepasst wurde . (Er wird als partieller Regressionskoeffizient bezeichnet und als .) "Y.=einX.+bZ.+ceinY.X.Z.rY.X..Z.

TEG
quelle
Ihre Zitate heben nur die Frage hervor. Können Sie Informationen darüber bereitstellen, was eine auf Regression basierende Anpassung ist?
Seanv507
Durch eine auf Regression basierende Anpassung beziehen sich die Autoren (in den vorhergehenden Absätzen) auf das, was wir manchmal als "Steuern für" andere Variablen bezeichnen: "Das Analogon einer Regressionslinie ist eine Regressionsebene, deren Gleichung wie ... Der Koeffizient gibt uns den Regressionskoeffizienten von auf bereits für angepasst wurde . (Er wird als partieller Regressionskoeffizient bezeichnet und als .) "Y.=einX.+bZ.+ceinY.X.Z.rYX.Z.
TEG
Fügen Sie dies vielleicht der Frage hinzu ... afaik dies könnte theoretisch immer noch für Interaktionsterme gemacht werden, wird aber normalerweise nicht in der Praxis gemacht
seanv507

Antworten:

5

Sie verbinden lineare Parameter mit linearen Variablen. Die Linearität bezieht sich hier auf die Beziehung zwischen den Variablen.

Ihr Punkt im Buch ist, dass, wenn das Modell in den Variablen nicht linear ist, auch nicht die Gleichung

Total Effect=Direkte Auswirkung+Indirekter Effekt

hält, noch der Regressionskoeffizient gibt Ihnen die richtige Anpassung der Hintertür direkt.

Berücksichtigen Sie beispielsweise im letzten Fall die bedingte Erwartung E.[Y.|x,z]]=βx+γz, die in Bezug auf linear ist X. und Z..

Wenn Z. erfüllt das Backdoor-Kriterium für die kausale Wirkung von X. auf Y., dann

E.[Y.|dÖ(x)]]x=E.[E.[Y.|x,Z.]]]]x=β

Das heißt, der Regressionskoeffizient β entspricht dem durchschnittlichen marginalen kausalen Effekt. Dies ist in diesem Fall unter "Regressionsbasierte Anpassungsarbeiten" zu verstehen. Hier sind keine zusätzlichen Schritte erforderlich. Die gesamte für die Backdoor-Anpassung erforderliche Mittelung erfolgt automatisch durch Regression.

Betrachten Sie nun die bedingte Erwartung E.[Y.|x,z]]=βx+γz+δ(x×z). Beachten Sie, dass dies in Bezug auf nicht linear istx und z (obwohl es in den Parametern linear ist).

Beachten Sie in diesem Fall, wenn Z. erfüllt das Backdoor-Kriterium für die kausale Wirkung von X. auf Y., dann

E.[Y.|dÖ(x)]]x=E.[E.[Y.|x,Z.]]]]x=β+δE.[z]]

Das heißt, die korrekte Anpassung der Hintertür ist nicht durch den Regressionskoeffizienten gegeben X. nur.

Ganz allgemein sagt Pearl, dass wenn Z. Wenn das Backdoor-Kriterium erfüllt ist, können Sie jeden nicht parametrischen Schätzer verwenden, den Sie bevorzugen, um die Verteilung nach dem Eingriff zu berechnen E.[Y.|dÖ(x)]]=E.[E.[Y.|x,Z.]]]].

Carlos Cinelli
quelle
Vielen Dank, @CarlosCinelli. Ich kenne Ihr Interesse an Perles Arbeit aus diesem Thread ( stats.stackexchange.com/a/376925/109647 ) und bin froh, dass Sie Zeit hatten, hier eine Antwort zu schreiben. Es ist detaillierter als die vorherige Antwort, stimmt aber grundsätzlich damit überein. Pearl bedeutet also im linearen Modell linear in Variablen , aber nicht in Parametern . Aber hier ist mein Problem: Der Begriff „linear“ im linearen Modell bezieht sich nicht darauf, in Variablen linear zu sein. Soweit ich weiß, tut es nie ...
TEG
Wie in dieser Antwort ( stats.stackexchange.com/a/8706/109647 ) angegeben, bezieht sich "linear" auf die Beziehung zwischen den von Ihnen geschätzten Parametern und dem Ergebnis. " Das ist eines der ersten Dinge, die ich in einem Regressionskurs gelernt habe. Sie können nichtlineare Beziehungen (z. B. Polynomterme) in linearer Regression modellieren. Wir behalten den Begriff nichtlinear für diejenigen Modelle bei, deren Parameter nicht linear sind (z.y=eβ+ε)…
TEG
Es scheint mir, dass ich nichts zusammenbringe, sondern nur um Klarstellung bitte. Beide Antworten laufen darauf hinaus: Perle bedeutet etwas anderes unter „linearem Modell“. Aber ich habe keinen Grund, den Begriff Pearl bevorzugt zu verwenden. Und lineare Modelle (wie in linear in den Parametern ) tun Interaktionen ermöglichen. Wenn ich nur die unterschiedliche Art und Weise übersehen habe, wie das „lineare Modell“ hier verwendet wird, werde ich diese Antwort akzeptieren.
TEG
Hallo @TEG, die Antwort, die Sie zitieren, spricht von Regressionsmodellen. Hier geht es um kausale (strukturelle) Modelle. Die Strukturgleichung y = f (x, z) ist linear, wenn f (x, z) eine lineare Funktion von x und z ist. Möglicherweise können Sie f (x, z) mit OLS und variablen Transformationen schätzen, aber f (x, z) ist immer noch nicht linear. Ein Strukturmodell wird als linear bezeichnet, wenn alle Funktionen linear sind. Dies ist nicht nur ein Unterschied in der Semantik - wenn das Strukturmodell nicht linear ist, dann, wie Pearl sagt: (1) Die Anpassung der Hintertür unterscheidet sich von der Regressionsanpassung. und (2) die Zerlegung TE = DE + IE gilt nicht
Carlos Cinelli
"Ein Strukturmodell wird als linear bezeichnet, wenn alle Funktionen linear sind" in Variablen, richtig? Also ein Modell wieY.=β0+β1X.1+β2X.2+β3(X.1×X.2)+εist im kausalen Modellierungsrahmen nicht linear.
TEG
2

"Rein lineare" Modelle lassen dies nicht zu. Wenn Sie eine Interaktion anhand eines bestimmten Falls des allgemeinen linearen Modells modellieren möchten (verwechseln Sie dies nicht mit einem verallgemeinerten linearen Modell), müssen Sie eine künstliche zusätzliche Variable wie das Produkt der beiden interagierenden Modelle einführen.

Dieses neue Modell ist in Bezug auf seine Parameter immer noch linear (dies ist wichtig, um die Schätzer zu erhalten), aber es ist in Bezug auf seine Variablen nicht mehr linear (Sie können nicht mehr über eine lineare Beziehung zwischen Regressoren und Ziel sprechen).

David
quelle
1
Vielen Dank. Was ist ein "rein lineares" Modell? Auch die Autoren haben einen solchen Begriff im Buch nicht verwendet.
TEG
1
Sie haben es nicht getan. Ich habe es gerade erfunden. Ich beziehe mich auf Modelle, die sowohl hinsichtlich der Variablen als auch der Parameter linear sind
David