Zufällige Zuordnung: Warum sich die Mühe machen?

Eine zufällige Zuordnung ist wertvoll, da sie die Unabhängigkeit der Behandlung von potenziellen Ergebnissen gewährleistet. Auf diese Weise führt dies zu unvoreingenommenen Schätzungen des durchschnittlichen Behandlungseffekts. Andere Zuweisungsschemata können jedoch auch systematisch die Unabhängigkeit der Behandlung von potenziellen Ergebnissen sicherstellen. Warum brauchen wir also eine zufällige Zuordnung? Anders ausgedrückt, was ist der Vorteil einer zufälligen Zuweisung gegenüber nicht zufälligen Zuweisungsschemata, die auch zu einer unvoreingenommenen Folgerung führen?

Sei ein Vektor von Behandlungszuordnungen, in dem jedes Element 0 (Einheit, die nicht der Behandlung zugeordnet ist) oder 1 (Einheit, die der Behandlung zugeordnet ist) ist. In einem JASA-Artikel sagen Angrist, Imbens und Rubin (1996, 446-47) , dass die Behandlungszuordnung zufällig ist, wenn für alle und so dass , wobei ist Spaltenvektor mit allen Elementen gleich 1. $\mathbf{Z}$ $Z_i$ $\Pr(\mathbf{Z} = \mathbf{c}) = \Pr(\mathbf{Z} = \mathbf{c'})$ $\mathbf{c}$ $\mathbf{c'}$ $\iota^T\mathbf{c} = \iota^T\mathbf{c'}$ $\iota$

Mit Worten, die Behauptung ist, dass die Zuweisung $Z_i$ zufällig ist, wenn ein Vektor von Zuweisungen, der $m$ Zuordnungen zur Behandlung enthält, genauso wahrscheinlich ist wie jeder andere Vektor, der $m$ Zuweisungen zur Behandlung enthält.

Um jedoch die Unabhängigkeit potenzieller Ergebnisse von der Behandlungszuweisung sicherzustellen, reicht es aus, sicherzustellen, dass jede Einheit in der Studie die gleiche Wahrscheinlichkeit für die Zuordnung zur Behandlung hat. Und das kann leicht auftreten, selbst wenn die meisten Behandlungszuweisungsvektoren keine Wahrscheinlichkeit haben, ausgewählt zu werden. Das heißt, es kann auch bei nicht zufälliger Zuweisung auftreten.

Hier ist ein Beispiel. Wir wollen ein Experiment mit vier Einheiten durchführen, in denen genau zwei behandelt werden. Es gibt sechs mögliche Zuweisungsvektoren:

1100
1010
1001
0110
0101
0011

wobei die erste Ziffer in jeder Nummer angibt, ob die erste Einheit behandelt wurde, die zweite Ziffer angibt, ob die zweite Einheit behandelt wurde, und so weiter.

Angenommen, wir führen ein Experiment durch, bei dem wir die Möglichkeit der Zuweisungsvektoren 3 und 4 ausschließen, bei dem jedoch jeder der anderen Vektoren die gleiche (25%) Chance hat, ausgewählt zu werden. Dieses Schema ist keine zufällige Zuordnung im Sinne von AIR. In Erwartung führt dies jedoch zu einer unvoreingenommenen Schätzung des durchschnittlichen Behandlungseffekts. Und das ist kein Zufall. Jedes Zuweisungsschema, das den Probanden die gleiche Wahrscheinlichkeit für die Zuordnung zur Behandlung gibt, ermöglicht eine unvoreingenommene Schätzung der ATE.

Also: Warum brauchen wir eine zufällige Zuordnung im Sinne von AIR? Mein Argument wurzelt in der Randomisierungsinferenz; Wenn man stattdessen in modellbasierter Inferenz denkt, scheint die AIR-Definition vertretbarer zu sein?

econometrics experiment-design causality instrumental-variables random-allocation user697473
quelle

Ich habe Angrist et al. Nicht gelesen, also fehlt mir vielleicht etwas, aber ich habe einen Streit mit Ihrer Formulierung. Wir verwenden keine zufällige Zuordnung, um sicherzustellen, dass die Behandlung unabhängig von den möglichen Ergebnissen ist. Ob die Behandlung in einem echten Experiment unabhängig von den Ergebnissen ist, hängt davon ab, ob ein direkter Kausalzusammenhang zwischen der Behandlung und dem Ergebnis besteht. Eine zufällige Zuordnung stellt vielmehr sicher, dass die Behandlung unabhängig von lauernden Variablen (oder potenziellen Störfaktoren) ist. Es ist möglich, dass das Ergebnis durch etwas anderes als die Behandlung verursacht wurde, die wir hoffentlich ausschließen möchten.

Gung - Reinstate Monica

@gung, ich denke, dass Sie "potenzielle Ergebnisse" und "Ergebnisse" miteinander verbinden. Es ist wahr, dass eine zufällige Zuordnung keine Unabhängigkeit der Behandlung von den Ergebnissen (dh von den beobachteten Ergebnissen) gewährleistet. Potenzielle Ergebnisse sind jedoch nicht die gleichen wie beobachtete Ergebnisse, und die zufällige Zuordnung gewährleistet die Unabhängigkeit der Behandlung von potenziellen Ergebnissen. Ich werde den ursprünglichen Beitrag nicht bearbeiten, um diesen Punkt zu erweitern. dies würde mich zu weit vom Hauptthema entfernen. Aber en.wikipedia.org/wiki/Rubin_causal_model kann in diesem Punkt hilfreich sein.

user697473

"[T] Um die Unabhängigkeit potenzieller Ergebnisse von der Behandlungszuweisung sicherzustellen, reicht es aus, sicherzustellen, dass jede Einheit in der Studie die gleiche Wahrscheinlichkeit für die Zuordnung zur Behandlung hat." Das ist falsch. Angenommen, Sie haben Männer und Frauen in eine Studie aufgenommen. Werfen Sie eine faire Münze: Wenn Sie Köpfe haben, ordnen Sie alle Frauen der Behandlungsgruppe (und alle Männer der Kontrollgruppe) zu. Bei Schwänzen befinden sich alle Männer in der Behandlungsgruppe und alle Frauen in der Kontrollgruppe. Jedes Subjekt hat (offensichtlich) eine 50% ige Chance, der Behandlungsgruppe zugeordnet zu werden - aber die Behandlung ist völlig mit dem Geschlecht verwechselt.

x

$x$

x

$x$

whuber

@whuber, dein Kommentar klingt nicht richtig. Um zu sehen, warum, nehmen wir = 1 an. Die möglichen Ergebnisse des Mannes sind Y (1) = 1 und Y (0) = 0. (Das heißt, = 1, wenn der Mann behandelt wird, 0, wenn nicht.) Für die Frau, Die möglichen Ergebnisse sind Y (1) = -1 und Y (0) = 2. (Die besonderen möglichen Ergebnisse spielen keine große Rolle, aber kleine ganze Zahlen halten die Dinge einfach.) Dann ist E [Y (1) | Z] = E [Y (1)] = 0. Ähnliche Gleichungen gelten für E [Y (0)]. Im Allgemeinen wird Ihr Zuweisungsmechanismus nicht mit dem Geschlecht verwechselt, und es wird eine unvoreingenommene ATE-Schätzung erstellt. Wenn ich etwas falsch verstehe, lassen Sie es mich bitte wissen.

x

$x$

Y_{m}

$Y_m$

user697473

Sicher, die Schätzung ist "unvoreingenommen" in dem Sinne, dass eine angehaltene Uhr eine unvoreingenommene Schätzung der Zeit liefert! Eigentlich ist es schlimmer als das: Diese Methode der zufälligen Auswahl liefert Ergebnisse, die nicht der Behandlung zugeordnet werden können, da sie genauso gut dem Geschlecht zugeordnet werden können. Das ist es, was Verwirrung bedeutet. Sich darauf zu konzentrieren, unvoreingenommene Ergebnisse zu

erzielen

Antworten:

Dies folgt auf Gungs Kommentar. Insgesamt ist der durchschnittliche Behandlungseffekt nicht der Punkt.

Angenommen, Sie haben neue Diabetesfälle, bei denen das Subjekt zwischen und alt ist , und neue Diabetes-Patienten über . Sie möchten der Behandlung die Hälfte zuweisen. Warum nicht eine Münze werfen und auf den Köpfen alle jungen Patienten und auf den Schwänzen alle älteren Patienten behandeln? Jeder hätte eine $1000$ $5$ $15$ $1000$ $30$ $50\%$ Die Chance, für die Behandlung ausgewählt zu werden, würde das durchschnittliche Ergebnis der Behandlung nicht beeinträchtigen, aber viele Informationen wegwerfen. Es wäre keine Überraschung, wenn sich herausstellen würde, dass jugendlicher Diabetes oder jüngere Patienten viel besser oder schlechter ansprechen als ältere Patienten mit Typ-II- oder Schwangerschaftsdiabetes. Der beobachtete Behandlungseffekt könnte unvoreingenommen sein, aber zum Beispiel hätte er eine viel größere Standardabweichung als durch zufällige Zuordnung, und trotz der großen Stichprobe könnten Sie nicht viel sagen. Wenn Sie eine zufällige Zuordnung verwenden, erhalten mit hoher Wahrscheinlichkeit etwa Fälle in jeder Altersgruppe die Behandlung, sodass Sie die Behandlung ohne Behandlung in jeder Altersgruppe vergleichen können. $500$

Möglicherweise können Sie es besser machen, als eine zufällige Zuordnung zu verwenden. Wenn Sie einen Faktor bemerken, von dem Sie glauben, dass er das Ansprechen auf die Behandlung beeinflusst, möchten Sie möglicherweise sicherstellen, dass Probanden mit diesem Attribut gleichmäßiger aufgeteilt werden, als dies durch zufällige Zuordnung der Fall wäre. Durch zufällige Zuordnung können Sie mit allen Faktoren gleichzeitig einigermaßen gut umgehen, sodass Sie anschließend viele mögliche Muster analysieren können.

Douglas Zare
quelle

Danke, Douglas. Diese Antwort macht für mich Sinn. Für die Aufzeichnung hatte ich nichts so Extremes im Sinn wie Ihr Beispiel oder das Beispiel von @ whuber oben. Ich dachte anstelle von Fällen, in denen wir nur einige wenige Behandlungsvektoren aus der Betrachtung streichen. (Stellen Sie sich einen Fall vor, in dem ein Kunde sagt: "Sie können diese oder jene Person behandeln, aber nicht beide.") Aber ich denke, dass Ihre allgemeinen Punkte auch für die milderen Fälle gelten, an die ich denke.

user697473

Ich denke, wenn Sie nur einige Vektoren eliminieren, ändern Sie nicht die Menge an Informationen, die Sie durch viel extrahieren können. Dies genau zu quantifizieren kann chaotisch sein - es gibt naive Grenzen, die wahrscheinlich zu pessimistisch sind.

Douglas Zare

@DouglasZare Ich habe eine Frage zu Ihrem extremen Beispiel. Ich glaube, das Ziel ist es herauszufinden, ob die Behandlung für die Bevölkerung mit jungen und alten Patienten wirksam ist. Dann generiert Ihre Methode zwei Stichproben, die nicht als repräsentative Stichprobe aus der potenziellen Ergebnisverteilung bei der alle Personen behandelt werden, und der potenziellen Ergebnisverteilung bei der alle Personen die Kontrolle übernehmen. Dann ist Ihr beobachteter Behandlungseffekt voreingenommen

F_{t}

$F_t$

F_{c}

$F_c$

KevinKim

In Ihrem Beispiel können Sie auch 2 und 5 weglassen und sich nicht widersprechen. Auf Gegenstandsstufe besteht immer noch die gleiche Chance, 1 oder 0 zu sein, wenn nur eine 1: 1-Wahrscheinlichkeit besteht, 1 oder 6 auszuwählen. Aber jetzt wird klarer, was Sie durch Entfernen von 3 und 4 getan haben.

John
quelle

Danke, John. Ja du hast Recht. Es scheint, dass wir in jeder Kombination so viele Behandlungszuweisungsvektoren eliminieren können, wie wir möchten, solange wir die verbleibenden Vektoren so verwenden, dass jede Einheit die gleiche Wahrscheinlichkeit für die Zuordnung zur Behandlung hat.

user697473

Ich glaube nicht, dass du verstehst, was ich sage. Was ich vorgestellt habe, ist der absurde Fall für Ihr Argument, das dagegen spricht.

John

Ihr Beispiel ist extrem, aber ich sehe nichts Absurdes daran. Dies ist eine gültige Demonstration des Punktes: Nicht zufällige Zuweisungsschemata (wie die Verwendung nur der Vektoren 1 und 6) können direkt zu einer unvoreingenommenen Schätzung des durchschnittlichen Behandlungseffekts führen. Daraus folgt, dass wir keine zufällige Zuordnung benötigen, um unvoreingenommene ATE-Schätzungen zu erhalten. Natürlich kann es noch Gründe geben, warum es schlecht ist, die Vektoren 2 bis 5 zu eliminieren. (Siehe Douglas Zares Kommentar oben .) Ich habe diese Gründe noch nicht durchdacht.

user697473

Du solltest. Deshalb kann man sie nicht beseitigen.

John

Hier ist eine weitere lauernde oder verwirrende Variable: Zeit (oder instrumentelle Drift, Auswirkungen der Probenlagerung usw.).
Es gibt also Argumente gegen die Randomisierung (wie Douglas sagt: Sie können es besser machen als die Randomisierung). Sie können beispielsweise im Voraus wissen, dass Ihre Fälle im Laufe der Zeit ausgeglichen werden sollen. So wie Sie vorher wissen können, dass Sie Geschlecht und Alter in Einklang bringen möchten.

Mit anderen Worten, wenn Sie eines Ihrer 6 Schemata manuell auswählen möchten, würde ich sagen, dass 1100 (oder 0011) eine ausgesprochen schlechte Wahl ist. Beachten Sie, dass die ersten Möglichkeiten, die Sie verworfen haben, diejenigen sind, die zeitlich am ausgewogensten sind ... Und die schlimmsten zwei bleiben übrig, nachdem John vorgeschlagen hat, auch 2 und 5 auszuschalten (gegen die Sie nicht protestiert haben).
Mit anderen Worten, Ihre Intuition, welche Schemata "nett" sind, führt leider zu einem schlechten experimentellen Design (IMHO ist dies ziemlich häufig; vielleicht sehen geordnete Dinge besser aus - und es ist sicher einfacher, logische Sequenzen während des Experiments zu verfolgen).

Sie können möglicherweise mit nicht randomisierten Schemata besser abschneiden, aber Sie können auch viel schlechter abschneiden. Meiner Meinung nach sollten Sie in der Lage sein, physikalische / chemische / biologische / medizinische / ... Argumente für das bestimmte nicht zufällige Schema, das Sie verwenden, anzugeben, wenn Sie sich für ein nicht zufälliges Schema entscheiden.

cbeleites unzufrieden mit SX
quelle