Darstellung von Interaktionseffekten in gerichteten azyklischen Diagrammen

17

Gerichtete azyklische Graphen (DAGs, z. B. Greenland et al., 1999) sind Teil eines Formalismus der kausalen Folgerung aus der kontrafaktischen Interpretation des Kausalitätslagers. In diesen Diagrammen bedeutet das Vorhandensein eines Pfeils von Variable EIN zu Variable B , dass Variable EIN Variable B direkt verursacht (eine gewisse Änderung des Risikos) , und das Fehlen eines solchen Pfeils bedeutet, dass Variable A die Variable B nicht direkt verursacht (eine gewisse Änderung des Risikos) von) Variable B .EINB

Beispielsweise wird die Aussage "Tabakrauchexposition verursacht direkt eine Veränderung des Mesotheliomrisikos" durch den schwarzen Pfeil von "Tabakrauchexposition" zu "Mesotheliom" in dem nicht nachstehenden DAG- Kausaldiagramm dargestellt.

Ebenso wird die Aussage "Asbestexposition verursacht direkt eine Veränderung des Mesotheliomrisikos" durch den schwarzen Pfeil von "Asbestexposition" zu "Mesotheliom" in der nicht DAG- kausalen Grafik unten dargestellt.

Ich benutze den Begriff " keine DAG" , um die folgende Kausaldarstellung aufgrund des roten Pfeils zu beschreiben, von dem ich behaupten möchte, dass "Asbestexposition eine Änderung der direkten kausalen Auswirkung der Tabakrauchexposition auf das Mesotheliomrisiko verursacht" (Asbest ist physikalisch) Eine Schädigung der Lungenzellen, die nicht nur eine direkte Veränderung des Mesotheliomrisikos hervorruft, sondern die Zellen auch anfälliger für krebserzeugende Schäden durch die Exposition gegenüber Tabakrauch macht, mit der Folge, dass sowohl die Exposition gegenüber Asbest als auch gegenüber Tabak zunimmt Das Risiko ist mehr als die Summe der beiden separaten Risiken. Dies entspricht nicht ganz der formalen Bedeutung der Kausalpfeile in den DAGs, die ich zu Beginn meiner Frage beschrieben habe (dh, weil der rote Pfeil nicht in einer Variablen endet)).

Kein gerichtetes azyklisches Diagramm: Die Exposition gegenüber Tabakrauch führt zu einem erhöhten Mesotheliomrisiko.  Asbestexposition verursacht erhöhtes Mesotheliomrisiko;  Asbestexposition führt zu einem Anstieg der kausalen Wirkung von Tabak auf das Mesotheliomrisiko.

Wie stellt man Interaktionseffekte im visuellen Formalismus einer DAG richtig dar?

Verweise

Greenland, S., Pearl, J. und Robins, JM (1999). Kausaldiagramme für die epidemiologische Forschung . Epidemiology , 10 (1): 37–48.

Alexis
quelle
Ist es möglich, die DAG zu ändern, indem ein Knoten für Lungenzellschäden mit Pfeilen von Tabak und Asbest und ein Pfeil für Mesotheliom hinzugefügt wird? Dies erhält die DAG und bietet Flexibilität bei der Modellierung der individuellen und zusammengesetzten Effekte.
John Woolf
Ja, ich hatte an so etwas gedacht, aber ich frage mich, ob das auch impliziert, dass der Haupteffekt von Tabak nicht auch "Lungenzellschaden" ist, wenn es so ist. Ich nehme an, man könnte eine weitere Variable "Tabak und Asbest zusammen" hinzufügen, die durch Tabak und Asbest verursacht wird, aber das scheint klobig zu sein ... aber vielleicht ist es das, was man tun muss.
Alexis
Mit welcher Software haben Sie die Grafik erstellt?
zipzapboing
@zipzapboing zeichnete es von Hand in MS Word oder PageStream oder Scribus oder etwas anderem und bearbeitete es dann mit GIMP für Farbe und Transparenz. (Es ist eigentlich ein Auszug aus einigen meiner Vortragsfolien.)
Alexis

Antworten:

8

Die Kausaltheorie von Pearl ist völlig unparametrisch . Aus diesem Grund werden Wechselwirkungen weder in der Grafik noch in den von ihr dargestellten Strukturgleichungen explizit angegeben. Kausale Effekte können jedoch unter der Annahme (stark) variieren.

Wenn ein Effekt identifiziert wird und Sie ihn nicht parametrisch aus Daten abschätzen, erhalten Sie eine vollständige Verteilung der kausalen Effekte (anstelle beispielsweise eines einzelnen Parameters). Dementsprechend können Sie den von der Asbestexposition abhängigen kausalen Effekt der Tabakexposition nicht parametrisch bewerten, um festzustellen, ob sie sich ändert, ohne sich auf eine funktionale Form festzulegen.

Werfen wir einen Blick auf die Strukturgleichungen in Ihrem Fall, die Ihrer vom roten Pfeil befreiten "DAG" entsprechen:

f1ϵm

f2ϵt

f3ϵein

ϵ

Wir haben die jeweiligen Funktionen f () und die Verteilung der Fehler nicht spezifiziert, mit der Ausnahme, dass diese unabhängig sind. Wir können jedoch Pearl's Theorie anwenden und sofort feststellen, dass die kausalen Auswirkungen sowohl der Tabak- als auch der Asbestexposition auf das Mesotheliom identifiziert werden . Dies bedeutet , dass , wenn wir aus diesem Prozess unendlich viele Beobachtungen hatten, konnten wir genau die Wirkung der Messung Einstellung der Belichtungen auf unterschiedlichen Ebenen durch einfaches Sehen Sie die Fälle von Mesotheliom in Individuen mit unterschiedlichen Ebenen der Exposition. Wir könnten also auf die Kausalität schließen, ohne ein tatsächliches Experiment durchzuführen. Dies liegt daran, dass es keine Hintertürpfade von den Expositionsvariablen zur Ergebnisvariablen gibt.

Also würdest du bekommen

P (Mesotheliom | do (Tabak = t)) = P (Mesotheliom | Tabak = t)

Dieselbe Logik gilt für die kausale Wirkung von Asbest, mit der Sie einfach Folgendes bewerten können:

P (Mesotheliom | Tabak = t, Asbest = a) - P (Mesotheliom | Tabak = t ', Asbest = a)

im Vergleich zu

P (Mesotheliom | Tabak = t, Asbest = a ') - P (Mesotheliom | Tabak = t', Asbest = a ')

für alle relevanten Werte von t und a, um die Wechselwirkungseffekte abzuschätzen.

Nehmen wir in Ihrem konkreten Beispiel an, dass die Ergebnisvariable eine Bernoulli-Variable ist - Sie können entweder ein Mesotheliom haben oder nicht - und dass eine Person einem sehr hohen Asbestpegel ausgesetzt war. Dann ist es sehr wahrscheinlich, dass er an einem Mesotheliom leidet. dementsprechend ist der Effekt der Erhöhung der Tabakexposition sehr gering. Wenn andererseits die Asbestkonzentrationen a 'sehr niedrig sind, hat eine zunehmende Tabakexposition eine größere Wirkung. Dies würde eine Wechselwirkung zwischen den Auswirkungen von Tabak und Asbest darstellen.

Natürlich kann die nichtparametrische Schätzung bei endlichen Daten und vielen verschiedenen t- und a-Werten extrem anspruchsvoll und verrauscht sein. Sie könnten sich also überlegen, eine Struktur in f () anzunehmen. Aber im Grunde kann man das auch ohne machen.

Julian Schüßler
quelle
Julian, danke für die eingehende Beschäftigung mit Pearl's kontrafaktischer Kausalitätslogik. Ihre Antwort würde verbessert werden, wenn Sie mit der visuellen Darstellung von Interaktionseffekten sprechen, die für meine Frage von zentraler Bedeutung war (möglicherweise sagen Sie "DAGs machen Interaktionseffekte nicht explizit", oder was Sie haben.)
Alexis
1
Ja, du hast recht; Ich habe ganz am Anfang versucht, das klarer zu machen.
Julian Schuessler
Julian, das ist großartig. Sie sagen, dass die Bausteine ​​einer DAG keine einzelnen Verknüpfungen sind, C = f (D), sondern allgemeiner Verknüpfungsmengen, C = f (D, E, ...). Mein Problem ist, dass Pearl diesbezüglich manchmal vage ist, z. B. in "Causality" (Kausalität) seines Def. 2.2.1 .: "Eine Kausalstruktur eines Satzes von Variablen V ist eine DAG, in der jeder Knoten einem bestimmten Element von V entspricht, und jeder link steht für eine direkte funktionale Beziehung zwischen den entsprechenden Variablen. " Sicherlich bedeuten die individuellen Verbindungen der Eltern von C zu C nichts für sich, sie zeigen nur die Beteiligung an einem kollektiven Einfluss auf C. Sie würden zustimmen?
Steve Powell
Ja. C = f (D, E) würde durch zwei Verknüpfungen in der Grafik von D / E bis C gezeigt. Die Interpretation der Verknüpfungen ist, dass D und E C bestimmen. Verknüpfungen sind also natürlich relational.
Julian Schuessler
10

Die einfache Antwort lautet, dass Sie dies bereits tun. Konventionelle DAGs repräsentieren nicht nur Haupteffekte, sondern die Kombination von Haupteffekten und Wechselwirkungen. Sobald Sie Ihre DAG gezeichnet haben, gehen Sie bereits davon aus, dass alle Variablen, die auf dasselbe Ergebnis verweisen, den Effekt der anderen Variablen, die auf dasselbe Ergebnis verweisen, ändern können. Dies ist eine Modellannahme, die von der DAG getrennt ist und das Fehlen einer Interaktion voraussetzt.

Darüber hinaus kann eine Interaktion erfolgen, ohne dass ein expliziter Interaktionsterm in Ihr Modell aufgenommen wird. Wenn Sie die Haupteffekte nur in ein Modell für das Risikoverhältnis von Y in Bezug auf die Behandlung T und die Kovariate Q einbeziehen, unterscheidet sich die Schätzung der Risikodifferenz in Abhängigkeit von der Höhe von Q. Um alle diese Möglichkeiten nichtparametrisch zu berücksichtigen, treffen die DAGs entsprechende Maßnahmen Nur die schwächsten Annahmen über die funktionale Form der Beziehungen zwischen den Variablen und die Annahme, dass keine Wechselwirkung vorliegt, sind eine stärkere Annahme, die eine Wechselwirkung zulässt. Dies bedeutet wiederum, dass DAGs bereits eine Interaktion ohne jegliche Anpassung ermöglichen. Siehe Vanderweele (2009) für eine Diskussion der Interaktion, die herkömmliche DAGs verwendet, aber Interaktion zulässt.

Bollen & Paxton (1998) und Muthén & Asparouhov (2015) zeigen beide Wechselwirkungen in Pfadmodellen mit latenten Variablen. Diese Wechselwirkungen beziehen sich jedoch explizit auf Produktterme in einem parametrischen Modell und nicht allgemein auf Wechselwirkungen. Ich habe auch ähnliche Diagramme gesehen, in denen der Kausalpfeil auf einen Pfad zeigt, aber genau genommen ist ein Pfad keine eindeutige Größe, auf die eine Variable einen kausalen Effekt haben kann (auch wenn wir unsere Modelle so interpretieren möchten). ; es repräsentiert einfach das Vorhandensein eines kausalen Effekts, nicht dessen Größe.


Bollen, KA & Paxton, P. (1998). Wechselwirkungen latenter Variablen in Strukturgleichungsmodellen. Structural Equation Modeling: A Multidisciplinary Journal, 5 (3), 267-293.

B. Muthén & T. Asparouhov (2015). Latent variable Wechselwirkungen.

VanderWeele, TJ (2009). Zur Unterscheidung zwischen Interaktion und Effektmodifikation. Epidemiology, 20 (6), 863 & ndash; 871.

Noah
quelle
3
Außerdem: "Sobald Sie Ihre DAG gezeichnet haben, gehen Sie bereits davon aus, dass alle Variablen, die auf dasselbe Ergebnis verweisen, den Effekt der anderen Variablen, die auf dasselbe Ergebnis verweisen, verändern können. Dies ist eine Modellannahme, die von der DAG getrennt ist und das Fehlen von DAG voraussetzt eine Interaktion. " ist genial ... es hat mir wirklich geholfen, mit diesen Ideen zu landen.
Alexis