Unterschied zwischen den Sprossen zwei und drei in der Ladder of Causation

12

In Judea Pearls "Book of Why" spricht er über das, was er als "Ladder of Causation" bezeichnet. Dies ist im Wesentlichen eine Hierarchie, die sich aus verschiedenen Ebenen kausalen Denkens zusammensetzt. Die niedrigste befasst sich mit Assoziationsmustern in beobachteten Daten (z. B. Korrelation, bedingte Wahrscheinlichkeit usw.), die nächste befasst sich mit Eingriffen (was passiert, wenn wir den Datenerzeugungsprozess auf eine bestimmte Weise absichtlich ändern?) Und die dritte mit kontrafaktisch (was würde in einer anderen möglichen Welt passieren, wenn etwas passiert wäre oder nicht)?

Was ich nicht verstehe, ist, wie Sprossen zwei und drei sich unterscheiden. Wenn wir eine kontrafaktische Frage stellen, stellen wir dann nicht einfach eine Frage zum Eingreifen, um einen Aspekt der beobachteten Welt zu negieren ?

causality dsaxton
quelle

Ist das wirklich ein Thema? Fragen aus Neugier

Firebug

5

@Firebug ist Kausalität zum Thema? Wenn Sie die Wahrscheinlichkeit von Kontrafakten berechnen möchten (z. B. die Wahrscheinlichkeit, dass ein bestimmtes Medikament für den Tod einer Person ausreicht), müssen Sie dies verstehen.

Carlos Cinelli

5

twitter.com/yudapearl/status/1069533953223155713 !

Tim

13

Es gibt keinen Widerspruch zwischen der tatsächlichen Welt und der Aktion des Interesses auf der interventionellen Ebene. Zum Beispiel sind Rauchen bis heute und das Aufhören mit dem Rauchen ab morgen kein Widerspruch, auch wenn man sagen könnte, das eine „negiert“ das andere. Stellen Sie sich nun das folgende Szenario vor. Sie kennen Joe, einen lebenslangen Raucher mit Lungenkrebs, und Sie fragen sich: Was wäre, wenn Joe dreißig Jahre lang nicht geraucht hätte, er wäre heute gesund? In diesem Fall haben wir es mit der gleichen Person zur gleichen Zeit zu tun und stellen uns ein Szenario vor, in dem Handlung und Ergebnis im direkten Widerspruch zu bekannten Tatsachen stehen.

Der Hauptunterschied zwischen Interventionen und Kontrafakten besteht also darin, dass Sie bei Interventionen fragen, was durchschnittlich passieren wird, wenn Sie eine Aktion ausführen, während Sie bei Kontrafakten fragen, was passiert wäre, wenn Sie in einer bestimmten Situation eine andere Vorgehensweise gewählt hätten , da Sie Informationen über das , was wirklich passiert ist . Beachten Sie, dass Sie, da Sie bereits wissen, was in der tatsächlichen Welt passiert ist, Ihre Informationen über die Vergangenheit im Lichte der von Ihnen beobachteten Beweise aktualisieren müssen.

Diese beiden Arten von Abfragen unterscheiden sich mathematisch, da für sie unterschiedliche Informationsebenen beantwortet werden müssen (für Kontrafakten müssen mehr Informationen beantwortet werden) und eine noch ausgefeiltere Sprache artikuliert werden muss !.

Mit den Informationen, die zur Beantwortung von Rung 3-Fragen benötigt werden, können Sie Rung 2-Fragen beantworten, aber nicht umgekehrt. Genauer gesagt, Sie können kontrafaktische Fragen nicht nur mit interventionellen Informationen beantworten. Beispiele für das Zusammentreffen von Interventionen und Kontrafakten finden Sie hier im Lebenslauf. Siehe diesen Beitrag und diesen Beitrag . Der Vollständigkeit halber möchte ich hier jedoch auch ein Beispiel anführen.

Das folgende Beispiel befindet sich in Causality, Abschnitt 1.4.4.

$x =1$ $x=0$ $y=0$ $y=1$ $P(y|x) = 0.5~~~\forall x,y$

$P(Y = 1|do(X = 1)) - P(Y=1|do(X =0) = 0$

$P(Y_{0} = 0|X =1, Y = 1)$

Diese Frage kann nicht nur mit den eingreifenden Daten beantwortet werden, die Sie haben. Der Beweis ist einfach: Ich kann zwei verschiedene Kausalmodelle erstellen, die die gleichen interventionellen Verteilungen und dennoch unterschiedliche kontrafaktische Verteilungen haben. Die zwei sind unten angegeben:

$U$ $P(y, x)$

Beachten Sie, dass im ersten Modell niemand von der Behandlung betroffen ist. Daher ist der Prozentsatz der Patienten, die unter der Behandlung starben und sich erholt hätten, wenn sie die Behandlung nicht genommen hätten, Null.

Im zweiten Modell ist jedoch jeder Patient von der Behandlung betroffen, und es liegt eine Mischung aus zwei Populationen vor, in denen der durchschnittliche kausale Effekt Null ist. In diesem Beispiel beträgt die kontrafaktische Menge jetzt 100%. In Modell 2 hätten sich alle Patienten, die unter Behandlung gestorben sind, erholt, wenn sie die Behandlung nicht genommen hätten.

Daher gibt es eine klare Unterscheidung zwischen Strompfad 2 und Strompfad 3. Wie das Beispiel zeigt, können Sie kontrafaktische Fragen nicht nur mit Informationen und Annahmen zu Interventionen beantworten. Dies wird durch die drei Schritte zur Berechnung eines Kontrafaktors verdeutlicht:

$P(u)$ $P(u|e)$
$do(x))$
$Y$

Dies kann nicht ohne funktionale Informationen zum Kausalmodell oder ohne Informationen zu latenten Variablen berechnet werden.

Carlos Cinelli
quelle

Interessante Antwort! Ein paar Folgemaßnahmen: 1) Sie sagen: " Mit Rung 3-Informationen können Sie Rung 2-Fragen beantworten, aber nicht umgekehrt. " Aber in Ihrem Rauchbeispiel verstehe ich nicht, wie das Wissen, ob Joe gesund wäre, wenn er nie geraucht hätte, die Frage beantwortet: "Wäre er gesund, wenn er morgen nach 30 Jahren mit dem Rauchen aufhören würde?". Sie scheinen unterschiedliche Fragen zu sein, also denke ich, dass mir etwas fehlt.

mkt - Setzen Sie Monica

In Ihrem nachfolgenden Beispiel wird davon ausgegangen, dass die beiden nicht beobachteten Variablen nicht zufällig zwischen der Behandlung und der Kontrolle verteilt sind. Sie haben dies jedoch als randomisiertes Experiment beschrieben. Handelt es sich also nicht um eine schlechte Randomisierung? Bei richtiger Randomisierung verstehe ich nicht, wie Sie zu zwei so unterschiedlichen Ergebnissen kommen, es sei denn, mir fehlt etwas Grundlegendes.

mkt - Setzen Sie Monica

@mkt vom Letzten zum Ersten. Die unbeobachtete Variable wird zufällig zwischen Behandelt und Kontrolle aufgeteilt. Sie haben genau 50% jeder Kategorie von u in beiden Armen. Mit Informationen ist die teilweise Spezifikation des Modells gemeint, die für die Beantwortung kontrafaktischer Anfragen im Allgemeinen erforderlich ist, nicht die Beantwortung einer bestimmten Anfrage. Um kontrafaktische Fragen zu beantworten, benötigen Sie die Kausalstruktur + einige funktionale Informationen oder Informationen zur Verteilung der latenten Variablen.

Carlos Cinelli

0

Hier ist die Antwort, die Judea Pearl auf Twitter gab :

Leser fragen: Warum unterscheidet sich die Intervention (Rung-2) von der kontrafaktischen Intervention (Rung-3)? Negiert das Eingreifen nicht einige Aspekte der beobachteten Welt?

Ans. Interventionen ändern sich, widersprechen aber nicht der beobachteten Welt, da die Welt vor und nach der Intervention zeitlich unterschiedliche Variablen enthält. Im Gegensatz dazu widerspricht "Wäre ich tot gewesen" bekannten Tatsachen. Eine aktuelle Diskussion finden Sie in dieser Diskussion .

Bemerkung: Sowohl Harvards # Causalinference-Gruppe als auch Rubins potenzielles Outcome-Framework unterscheiden Rung-2 nicht von Rung-3.

Ich glaube, dies ist ein kultureller Widerstand, der in Zukunft korrigiert werden wird. Es stammt aus dem Ursprung beider Frameworks in der Metapher "wie zufällig", im Gegensatz zu der physischen Metapher "Zuhören" von #Bookofwhy

Benjamin Crouzier
quelle

Unterschied zwischen den Sprossen zwei und drei in der Ladder of Causation

Antworten: