Warum sollte man in einer Situation, in der die Zuordnung zur Behandlungsgruppe zufällig ist, eine beliebige Anzahl von Basiskovariaten kontrollieren wollen?
Mein Verständnis ist, dass eine zufällige Zuordnung der Behandlung die Behandlungsvariable streng exogen machen sollte, wodurch eine Kontrollgruppe entsteht, die angemessen als kontrafaktisch angesehen werden kann. Die einzige Ausnahme, an die ich denken kann, ist, wenn die Stichprobengröße klein ist und diese zufällige Zuordnung immer noch zu unausgeglichenen Gruppen führen kann.
Aus frequentistischer Sicht kann ein nicht angepasster Vergleich auf der Grundlage der Permutationsverteilung nach einer (richtig) randomisierten Studie immer gerechtfertigt sein. Eine ähnliche Begründung kann für eine Folgerung auf der Grundlage gemeinsamer parametrischer Verteilungen (z. B. der Verteilung oder der Verteilung) aufgrund ihrer Ähnlichkeit mit der Permutationsverteilung gegeben werden. Tatsächlich besteht bei der Anpassung an Kovariaten - wenn sie anhand von Post-hoc-Analysen ausgewählt werden - die Gefahr, dass der Fehler vom Typ I aufgeblasen wird. Es ist zu beachten, dass diese Rechtfertigung nichts mit dem Gleichgewichtsgrad in der beobachteten Probe oder mit der Größe der Probe zu tun hat (außer dass bei kleinen Proben die Permutationsverteilung diskreter ist und durch das weniger gut angenähert wirdF t F.tF.toder Verteilungen).F.
Vielen Menschen ist jedoch bewusst, dass die Anpassung an Kovariaten die Genauigkeit des linearen Modells erhöhen kann. Insbesondere erhöht die Anpassung an Kovariaten die Genauigkeit des geschätzten Behandlungseffekts, wenn sie das Ergebnis vorhersagen und nicht mit der Behandlungsvariablen korrelieren (wie dies im Fall einer randomisierten Studie der Fall ist). Weniger bekannt ist jedoch, dass dies nicht automatisch auf nichtlineare Modelle übertragen wird. Zum Beispiel Robinson und Jewell [1] zeigen , dass bei der logistischen Regression, für Kovariaten Steuerung reduziert die Genauigkeit der Behandlungswirkung geschätzt, auch wenn sie über die Ergebnisse prädiktiver ist. Da jedoch der geschätzte Behandlungseffekt ist auch größer in dem angepassten Modell, Controlling für Kovariaten prädiktiv für das Ergebnis tut Steigerung der Effizienz beim Testen der Nullhypothese ohne Behandlungseffekt nach einer randomisierten Studie.
[1] LD Robinson und NP Jewell. Einige überraschende Ergebnisse zur kovariaten Anpassung in logistischen Regressionsmodellen. International Statistical Review , 58 (2): 227–40, 1991.
Hallo - interessante Antwort. Haben Sie Interesse an einem Offline-Gespräch darüber?
Rolando2
12
Wenn das Ergebnis von der Behandlung sowie anderen beobachtbaren Faktoren abhängt, verbessert die Kontrolle der letzteren häufig die Genauigkeit der Auswirkungsschätzung (dh der Standardfehler des Behandlungseffekts ist geringer). Wenn die Stichprobengröße klein ist, kann dies hilfreich sein.
Hier ist eine einfache Simulation, bei der der Standardfehler trotz zufälliger Behandlung um ein Drittel kleiner wird:
. set obs 100
obs was 0, now 100
. gen treat =mod(_n,2)
. gen x=rnormal()
. gen y = 2 + 3*treat + 1*x + rnormal()
. reg y treat
Source | SS df MS Number of obs = 100
-------------+------------------------------ F( 1, 98) = 112.75
Model | 209.354021 1 209.354021 Prob > F = 0.0000
Residual | 181.973854 98 1.85687606 R-squared = 0.5350
-------------+------------------------------ Adj R-squared = 0.5302
Total | 391.327875 99 3.95280682 Root MSE = 1.3627
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
treat | 2.893814 .2725345 10.62 0.000 2.352978 3.43465
_cons | 2.051611 .192711 10.65 0.000 1.669183 2.43404
------------------------------------------------------------------------------
. reg y treat x
Source | SS df MS Number of obs = 100
-------------+------------------------------ F( 2, 97) = 180.50
Model | 308.447668 2 154.223834 Prob > F = 0.0000
Residual | 82.8802074 97 .854435127 R-squared = 0.7882
-------------+------------------------------ Adj R-squared = 0.7838
Total | 391.327875 99 3.95280682 Root MSE = .92436
------------------------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
treat | 2.918349 .1848854 15.78 0.000 2.551403 3.285295
x | 1.058636 .0983022 10.77 0.000 .8635335 1.253739
_cons | 1.996209 .130825 15.26 0.000 1.736558 2.25586
------------------------------------------------------------------------------
+1 - Ein weiterer Grund ist die Identifizierung von Interaktionseffekten mit der Behandlung. Dies erfordert jedoch mehr als nur die "Kontrolle" anderer Faktoren wie des genannten OP.
Andy W
Vielen Dank! Wenn sich also eine oder mehrere Kovariaten auf das Ergebnis auswirken, das Sie messen möchten, verbessert die Aufnahme in Ihr Modell die Genauigkeit Ihrer Schätzung des zufällig zugewiesenen Behandlungseffekts, hat jedoch keinen wirklichen Einfluss auf Ihre Schätzung des Werts des Behandlungskoeffizient, richtig?
Robb
Ja, das ist richtig.
Dimitriy V. Masterov
Entschuldigung für Off-Topic-Ping: Es gibt einen Vorschlag für Meta, [randomisiertes Experiment] zu einem Synonym für das [zufällige Zuweisung] -Tag zu machen ( stats.meta.stackexchange.com/a/4651 ). Sie haben genug Ruf in diesem Tag, um hier für diesen Vorschlag zu stimmen: stats.stackexchange.com/tags/random-allocation/synonyms - es sind jetzt 4 Upvotes erforderlich, um durchzugehen. Wenn Sie mit dem Vorschlag nicht einverstanden sind, sollten Sie Meta kommentieren, um zu erklären, warum. Ich werde diesen Kommentar bald löschen. Prost.
Wenn das Ergebnis von der Behandlung sowie anderen beobachtbaren Faktoren abhängt, verbessert die Kontrolle der letzteren häufig die Genauigkeit der Auswirkungsschätzung (dh der Standardfehler des Behandlungseffekts ist geringer). Wenn die Stichprobengröße klein ist, kann dies hilfreich sein.
Hier ist eine einfache Simulation, bei der der Standardfehler trotz zufälliger Behandlung um ein Drittel kleiner wird:
quelle