Unbestimmtheit in Rubins Kausalmodell - Laienerklärung

11

Bei der Implementierung von Rubins Kausalmodell ist eine der (nicht testbaren) Annahmen, die wir brauchen, Unbegründetheit, was bedeutet

(Y.(0),Y.(1))T.|X.

Wo die LHS die Kontrafakten sind, ist das T die Behandlung und X sind die Kovariaten, auf die wir kontrollieren.

Ich frage mich, wie ich das einer Person beschreiben soll, die nicht viel über das Rubin-Kausalmodell weiß. Ich verstehe, warum wir diese Annahme theoretisch brauchen, bin mir aber konzeptionell nicht sicher, warum dies wichtig ist. Wenn T die Behandlung ist, sollte das potenzielle Ergebnis dann nicht stark davon abhängen? Wenn wir auch, eine randomisierte , kontrollierte Studie, dann automatisch, . Warum gilt das?(Y.(0),Y.(1))T.

Wie würden Sie jemandem, der das RCM nicht studiert hat, die Annahme der Unbegründetheit / Unwissenheit beschreiben?

RayVelcoro
quelle
Was die Neigungsbewertung betrifft, so ist zunächst leicht zu beweisen, dass die bedingte Verteilung von mit der bedingten Verteilung von übereinstimmt . Daher impliziert Unbegründetheit / Unwissenheit, dass . Für randomisierte Studien muss unabhängig von anderen Variablen sein, die an den Studien teilnehmen. X | T = 0 , p ( X ) = q ( Y ( 0 ) , Y ( 1 ) ) T | p ( X ) T.X. | T.=1,p(X.)=qX. | T.=0,p(X.)=q(Y.(0),Y.(1))  T. | p(X.)T.
Viktor

Antworten:

11

Wie würden Sie jemandem, der das RCM nicht studiert hat, die Annahme der Unbegründetheit / Unwissenheit beschreiben?

In Bezug auf die Intuition für jemanden, der sich nicht mit kausalen Schlussfolgerungen auskennt, denke ich, dass Sie hier Diagramme verwenden können. Sie sind intuitiv in dem Sinne, dass sie visuell "Fluss" zeigen und sie werden auch klar machen, was Ignorierbarkeit in der realen Welt im Wesentlichen bedeutet.

Bedingte Ignorierbarkeit entspricht der Behauptung, dass das Backdoor-Kriterium erfüllt. In intuitiven Begriffen können Sie der Person also sagen, dass die für Kovariaten die Wirkung häufiger Ursachen von und "blockieren" (und keine anderen falschen Assoziationen eröffnen).X.X.X.T.Y.

Wenn die einzigen denkbaren verwirrenden Variablen Ihres Problems die Variablen auf selbst sind, ist dies trivial zu erklären. Sie sagen nur, dass alles ist, was Sie kontrollieren müssen , da alle häufigen Ursachen von und . Man könnte ihr also sagen, dass man die Welt so sieht:X.X.X.T.Y.

Geben Sie hier die Bildbeschreibung ein

Der interessantere Fall ist, wenn es andere plausible Störfaktoren gibt. Um genauer zu sein, könnten Sie sogar die Person bitten , ein Potential confounder Ihr Problem zu nennen - das heißt, sie zu bitten, etwas zu nennen , die sowohl verursacht und , aber es ist nicht in .T.Y.X.

Sagen Sie den Personennamen eine Variable . Dann können Sie dieser Person sagen, dass Ihre Annahme der bedingten Ignorierbarkeit effektiv bedeutet, dass Sie glauben, die Wirkung von auf und / oder "blockieren" . Z.X.Z.T.Y.

Und Sie sollten ihr einen wesentlichen Grund nennen, warum Sie denken, dass das wahr ist. Es gibt viele Diagramme, die das darstellen könnte, aber sagen Sie mit dieser Erklärung kommen: „ wird nicht spannen die Ergebnisse , denn auch wenn verursacht und , seine Wirkung auf geht nur durch , die wir kontrollieren“. Z.Z.T.Y.T.X.Und dann zeigen Sie diese Grafik:

Geben Sie hier die Bildbeschreibung ein

Und Sie könnten an andere Mitbegründer denken und ihr zeigen, wie sie in den Grafiken visuell blockiert.X.

Beantworten Sie nun die konzeptionellen Fragen:

Wenn T die Behandlung ist, sollte das potenzielle Ergebnis dann nicht stark davon abhängen? Wenn wir eine randomisierte kontrollierte Studie haben, dann automatisch. Warum gilt das?

Stellen Sie sich als Behandlungsaufgabe vor. Es heißt, dass Sie die Behandlung Personen zuweisen, die "ignorieren", wie sie auf die Behandlung reagieren (die kontrafaktischen potenziellen Ergebnisse). Eine einfache Verletzung davon wäre, dass Sie dazu neigen, diejenigen zu behandeln, die möglicherweise am meisten davon profitieren würden.T.

Das ist auch der Grund, warum dies automatisch gilt, wenn Sie zufällig auswählen. Wenn Sie die behandelten Personen zufällig auswählen, bedeutet dies, dass Sie ihre möglichen Reaktionen auf die Behandlung nicht überprüft haben, um sie auszuwählen.


Um die Antwort zu ergänzen, ist es erwähnenswert, dass es wirklich schwierig ist, Unwissenheit zu verstehen, ohne über den kausalen Prozess zu sprechen, dh ohne Strukturgleichungen / grafische Modelle aufzurufen. Die meiste Zeit sehen Sie Forscher, die sich auf die Idee berufen, "die Behandlung sei wie zufällig", ohne jedoch zu rechtfertigen, warum dies so ist oder warum dies unter Verwendung realer Mechanismen und Prozesse plausibel ist.

Tatsächlich gehen viele Forscher aus Bequemlichkeitsgründen einfach von Unwissenheit aus, um die Verwendung statistischer Methoden zu rechtfertigen. Diese Passage aus dem Papier von Joffe, Yang und Feldman spricht eine unangenehme Wahrheit, die die meisten Menschen kennen, aber während der Konferenzpräsentationen nicht sagen: "Ignorierbarkeitsannahmen werden normalerweise getroffen, weil sie die Verwendung verfügbarer statistischer Methoden rechtfertigen, und nicht, weil die wirklich geglaubt werden."

Aber, wie ich am Anfang der Antwort gesagt habe, können Sie mithilfe von Diagrammen darüber streiten, ob eine Behandlungsaufgabe ignorierbar ist oder nicht. Während das Konzept der Ignorierbarkeit selbst schwer zu verstehen ist, weil es Urteile über kontrafaktische Größen enthält, machen Sie in den Diagrammen grundsätzlich qualitative Aussagen über kausale Prozesse (diese Variable verursacht diese Variable usw.), die leicht zu erklären und visuell ansprechend sind.

Wie bereits in einer früheren Antwort erwähnt, besteht eine formale Äquivalenz zwischen Diagrammen und potenziellen Ergebnissen . Daher können Sie potenzielle Ergebnisse auch aus Diagrammen ablesen. Wenn Sie diese Verbindung formaler gestalten (weitere Informationen finden Sie unter Pearl's Causality, S. 343), können Sie auf die folgende Definition zurückgreifen: Die potenziellen Ergebnisse würden für die Summe aller Variablen (beobachtete und Fehlerterme) stehen, die Y beeinflussen, wenn T konstant gehalten wird .

Dann ist es leicht zu verstehen, warum Unwissenheit in RCT gilt, aber was noch wichtiger ist, es ermöglicht Ihnen auch, Situationen leicht zu erkennen, in denen Unwissenheit nicht gelten würde. Zum Beispiel ist in dem Diagramm T ignorierbar, aber T ist bei X nicht bedingt ignorierbar, da Sie, sobald Sie auf X konditionieren, einen kollidierenden Pfad vom Fehlerterm von X nach T öffnen.T.X.Y.

Zusammenfassend lässt sich sagen, dass viele Forscher der Einfachheit halber standardmäßig die Unwissenheitsannahme annehmen. Es ist eine bequeme Möglichkeit, die Angemessenheit einer Reihe von Kontrollen anzunehmen, ohne formal begründen zu müssen, warum dies der Fall ist. Um jedoch zu erklären, was dies in einem realen Kontext für einen Laien bedeutet, müssten Sie eine kausale Geschichte aufrufen, dh kausale Annahmen und Sie können diese Geschichte formell mit Hilfe von Kausaldiagrammen erzählen.

Carlos Cinelli
quelle
8

(Y.0,Y.1)Y.

X.

Y.=T.Y.1+(1- -T.)Y.0.

Y.T.T.Y.1(1- -T.)Y.0

T.X.X.Y.1X.

Dimitriy V. Masterov
quelle
Schauen Sie sich den Teil an, in dem Sie sagen: "Ich glaube, Sie werden über den Unterschied zwischen potenziellen Ergebnissen (Y0, Y1) und dem beobachteten Ergebnis Y aufgehängt. Letzteres wird stark von der Behandlung beeinflusst, aber wir hoffen, dass das erstere Paar dies nicht tut." "" Kann dies interpretiert werden als "Das beobachtete Ergebnis hängt von der Behandlung ab, aber unter der Nullhypothese, dass kein Behandlungseffekt vorliegt, sollte die Behandlung die potenziellen Ergebnisse nicht beeinflussen"? Warum hoffen wir, dass die möglichen Ergebnisse durch die Behandlungen beeinflusst werden
RayVelcoro
1
Y.1- -Y.0
T.Y.1(1- -T.)Y.0Y.T.
@ user321627 Wenn Sie den Unterschied in den beobachteten Ergebnismitteln für Behandlung und Kontrolle berechnen, sollte dies offensichtlich sein.
Dimitriy V. Masterov