Wie gut kann multiple Regression Kovariaten wirklich „kontrollieren“?

45

Wir alle kennen Beobachtungsstudien, die versuchen, einen Kausalzusammenhang zwischen einem nicht randomisierten Prädiktor X und einem Ergebnis herzustellen, indem jeder erdenkliche potenzielle Störfaktor in ein multiples Regressionsmodell einbezogen wird. Indem wir also alle Störfaktoren "kontrollieren", so das Argument, isolieren wir den Effekt des interessierenden Prädiktors.

Ich empfinde diese Idee zunehmend als unangenehm, hauptsächlich aufgrund von Bemerkungen, die verschiedene Professoren meiner Statistikklassen gemacht haben. Sie fallen in ein paar Hauptkategorien:

1. Sie können nur Kovariaten kontrollieren, an die Sie denken und die Sie messen.
Dies ist offensichtlich, aber ich frage mich, ob es tatsächlich das schädlichste und unüberwindlichste von allen ist.

2. Der Ansatz hat in der Vergangenheit zu hässlichen Fehlern geführt.

Zum Beispiel diskutieren Petitti & Freedman (2005) , wie statistisch angepasste Beobachtungsstudien im Wert von Jahrzehnten zu katastrophal falschen Schlussfolgerungen über die Wirkung der Hormonersatztherapie auf das Herzkrankheitsrisiko kamen. Spätere RCTs fanden fast entgegengesetzte Effekte.

3. Die Prädiktor-Ergebnis-Beziehung kann sich seltsam verhalten, wenn Sie auf Kovariaten kontrollieren.

Yu-Kang Tu, Gunnell & Gilthorpe (2008) diskutieren verschiedene Erscheinungsformen, darunter Lord's Paradox, Simpsons Paradox und Suppressorvariablen.

4. Für ein einzelnes Modell (multiple Regression) ist es schwierig, Kovariaten angemessen zu berücksichtigen und gleichzeitig die Prädiktor-Ergebnis-Beziehung zu modellieren.

Ich habe dies als Grund für die Überlegenheit von Methoden wie Neigungsbewertungen und Schichtung auf Störfaktoren gehört, bin mir aber nicht sicher, ob ich das wirklich verstehe.

5. Das ANCOVA-Modell setzt voraus, dass die Kovariate und der Prädiktor von Interesse unabhängig sind.

Natürlich passen wir Confounder genau an, WEIL sie mit dem interessierenden Prädiktor korrelieren. Es scheint also, dass das Modell in genau den Fällen, in denen wir es am meisten wollen, nicht erfolgreich sein wird. Es wird argumentiert, dass die Anpassung nur zur Rauschreduzierung in randomisierten Studien geeignet ist. Miller & Chapman, 2001 geben eine großartige Rezension.

Meine Fragen sind also:

  1. Wie ernst sind diese und andere Probleme, von denen ich vielleicht nichts weiß?
  2. Wie ängstlich sollte ich sein, wenn ich eine Studie sehe, die "für alles kontrolliert"?

(Ich hoffe, dass diese Frage nicht zu weit in das Diskussionsgebiet vordringt und lade gerne Vorschläge ein, um sie zu verbessern.)

EDIT : Ich habe Punkt 5 hinzugefügt, nachdem ich eine neue Referenz gefunden habe.

Halbpass
quelle
1
Bei Frage 2 denke ich, dass „Kontrollen für alles“ eine allgemeinere Frage der Spezifikation ist. Es fällt mir schwer, mir eine Situation vorzustellen, in der ein parametrisches Modell korrekt angegeben ist. Abgesehen davon vereinfacht ein Modell die Realität, und hier liegt die Kunst dieser Art des Studiums. Der Forscher muss entscheiden, was im Modell wichtig ist und was nicht.
Kirk
4
Mit dieser Frage hast du mich zum Fan gemacht.
Rolando2
1
Ich denke, das wirft einige sehr gute Punkte auf. Aber ich denke, die Antworten liegen außerhalb des rein statistischen Bereichs. Somit ist jedes statistische Ergebnis wertvoller, wenn es 1) repliziert wird 2) im Wesentlichen realisierbar ist usw. Siehe auch die MAGIC-Kriterien und das allgemeine Argument, das Abelson vorbringt.
Peter Flom - Wiedereinsetzung von Monica
1
Punkt 5 ist absolut falsch. Das Miller & Chapman-Papier ist völlig falsch, Punkt.
Jake Westfall
1
@ half-pass Ich bin mir nicht sicher, was ich dazu sagen soll, außer dass die zentrale Behauptung der Veröffentlichung, dass der fokale Prädiktor X und die Kovariate C unkorreliert sein müssen, einfach nicht wahr ist. Beachten Sie, dass ANCOVA nur ein Regressionsmodell ist, sodass dieselbe Argumentationslinie anscheinend fast alle realen Verwendungen der multiplen Regression ungültig machen würde! Ich hatte vor einigen Monaten einige Twitter-Diskussionen über dieses schreckliche Papier: twitter.com/CookieSci/status/902298218494644228
Jake Westfall

Antworten:

4

Es gibt eine allgemein akzeptierte, möglicherweise nicht statistische Antwort auf die Frage, welche Annahmen man treffen muss, um zu behaupten, man habe die Kovariaten wirklich unter Kontrolle.

Dies kann mit den kausalen Graphen von Judea Pearl und mit Kalkül erfolgen .

Siehe http://ftp.cs.ucla.edu/pub/stat_ser/r402.pdf sowie anderes Material auf seiner Website.

Jetzt als Statistiker wissen wir, dass alle Modelle falsch sind, und die wahre statistische Frage sind die identifizierten Annahmen, die wahrscheinlich nicht zu falsch sind, so dass unsere Antwort ungefähr in Ordnung ist. Pearl ist sich dessen bewusst und diskutiert es in seiner Arbeit, aber vielleicht nicht explizit und oft genug, um zu vermeiden, dass viele Statistiker mit seinem Anspruch, eine Antwort zu haben , frustriert werden (was tut er wohl für welche Annahmen, die man machen muss? ).

(Derzeit bietet die ASA einen Preis für Lehrmaterial an, um diese Methoden in statistische Kurse aufzunehmen, siehe hier )

Phaneron
quelle
Toller Hinweis auf eine elegante grafische Darstellung, danke.
Halb passieren
0

Antwort auf Frage 1:

  • Das Ausmaß der Schwere lässt sich am besten kontextbezogen beurteilen (dh es sollten alle Faktoren berücksichtigt werden, die zur Validität beitragen).
  • Das Ausmaß der Schwere sollte nicht kategorisch beurteilt werden. Ein Beispiel ist der Begriff einer Inferenzhierarchie für Studiendesigns (z. B. Fallberichte sind am niedrigsten und RCTs sind kategorisch am höchsten). Diese Art von Schema wird häufig an medizinischen Fakultäten als einfache Heuristik gelehrt, um schnell qualitativ hochwertige Nachweise zu identifizieren. Das Problem bei dieser Art des Denkens ist, dass die Antwort selbst überbestimmt ist, da sie algorithmisch und in Wirklichkeit zu deterministisch ist. In diesem Fall können Sie die Möglichkeiten verpassen, mit denen schlecht konzipierte RCTs schlechtere Ergebnisse erzielen können als eine gut konzipierte Beobachtungsstudie.
  • In diesem übersichtlichen Bericht finden Sie eine vollständige Diskussion der oben genannten Punkte aus der Sicht eines Epidemiologen (Rothman, 2014) .

Antwort auf Frage 2:

Flaunk
quelle