Wie überprüft man die Ursache?

9

Nachdem wir gezeigt haben, dass zwei Größen korreliert sind, wie schließen wir daraus, dass die Beziehung kausal ist? Und außerdem was verursacht was? Theoretisch kann man nun eine "zufällige Zuordnung" (was auch immer das richtige Wort ist) verwenden, um eventuelle Unfallbindungen zwischen zwei Variablen aufzubrechen. In einigen Fällen ist dies jedoch nicht möglich. Überlegen Sie beispielsweise, wie oft eine Person raucht, gemessen in Zigaretten pro Woche, im Vergleich zur Lebenserwartung, gemessen in Jahren. Wir können zufällig zwei Gruppen von Menschen auswählen. Lassen Sie eine Gruppe rauchen und die andere nicht. Da die Zuordnung zufällig ist, sollte dies alle anderen Beziehungen zwischen ihnen unterbrechen. Dies ist aber natürlich aus vielen verschiedenen Gründen nicht möglich. Welche Techniken können verwendet werden?

Nicolas Bourbaki
quelle
1
Durch sorgfältig geplante Experimente. ;-)
StatsStudent
@StatsStudent Welche Experimente? Nehmen wir zum Beispiel Zigaretten gegen Lebenserwartung. Möchten Sie dieses Experiment wirklich unter einer Kontrollbedingung durchführen, wenn Sie der Meinung sind, dass sie die Lebenserwartung senken? Mit Experimenten ist es einfach, die Ursache zu überprüfen. Aber wie macht man das aus einem Korrelationsplot?
Nicolas Bourbaki
@NicolasBourbaki Ihre Frage beginnt mit der Annahme, dass die Mengen korreliert sind. Bedeutet dies, dass wir auch davon ausgehen, dass die Variablen linear zusammenhängen, wie z. B. Y = A * X + B?
Cantorhead
@NicolasBourbaki Man könnte und viele würden X als "verursachend" Y betrachten . Andererseits sind X ( t ) und Y ( t + 1 ) nicht korreliert. Y.(t+1)=cos(X.(t))- -1+nÖichseX.Y.X.(t)Y.(t+1)
Cantorhead
@NicolasBourbaki Ich habe eine Antwort unter der Annahme der Linearität unten angegeben und möchte eine allgemeinere Antwort geben, aber es wäre nicht zum Thema, wenn Sie nur an linearen Beziehungen interessiert sind.
Cantorhead

Antworten:

5

Ich denke, das ist eine sehr gute Frage. Ich stoße oft auf dieses Problem und denke viel darüber nach. Ich forsche in der Medizin und die Vorstellung in der Medizin ist, dass nichts als kausal erwiesen ist, niemals, niemals, niemals, bis eine randomisierte klinisch kontrollierte Studie, vorzugsweise mit einer Pille (oder einer anderen Exposition, die dreifach verblindet sein kann), bewiesen hat eine Auswirkung auf die Reaktion von Interesse. Dies ist ziemlich traurig, da alle anderen Studien als Assoziationsstudien betrachtet werden, die dazu neigen, ihre Auswirkungen zu verringern.

Hill und Richard Doll haben darüber nachgedacht. Ersteres formulierte Hill's Kriterien für die Kausalität:

Die Bradford Hill-Kriterien, auch bekannt als Hill's Kriterien für die Verursachung, sind eine Gruppe von Mindestbedingungen, die erforderlich sind, um einen kausalen Zusammenhang zwischen einer Inzidenz und einer Konsequenz hinreichend nachzuweisen, der vom englischen Epidemiologen Sir Austin Bradford Hill (1897–1991) in 1965.


Stärke : Eine kleine Assoziation bedeutet nicht, dass es keinen kausalen Effekt gibt. Je größer die Assoziation, desto wahrscheinlicher ist es, dass sie kausal ist. Konsistenz : Konsistente Befunde, die von verschiedenen Personen an verschiedenen Orten mit unterschiedlichen Proben beobachtet wurden, erhöhen die Wahrscheinlichkeit eines Effekts. Spezifität : Ursache ist wahrscheinlich, wenn eine sehr spezifische Population an einem bestimmten Ort und einer bestimmten Krankheit keine andere wahrscheinliche Erklärung hat. Je spezifischer eine Assoziation zwischen einem Faktor und einem Effekt ist, desto größer ist die Wahrscheinlichkeit eines Kausalzusammenhangs. Zeitlichkeit : Der Effekt muss nach der Ursache auftreten (und wenn zwischen der Ursache und dem erwarteten Effekt eine erwartete Verzögerung besteht, muss der Effekt nach dieser Verzögerung auftreten). Biologischer Gradient : Eine stärkere Exposition sollte im Allgemeinen zu einer höheren Inzidenz des Effekts führen. In einigen Fällen kann jedoch das bloße Vorhandensein des Faktors den Effekt auslösen. In anderen Fällen wird ein umgekehrter Anteil beobachtet: Eine höhere Exposition führt zu einer geringeren Inzidenz. Plausibilität : Ein plausibler Mechanismus zwischen Ursache und Wirkung ist hilfreich (Hill stellte jedoch fest, dass das Wissen über den Mechanismus durch das aktuelle Wissen begrenzt ist). Kohärenz : Die Kohärenz zwischen epidemiologischen und Laborbefunden erhöht die Wahrscheinlichkeit eines Effekts. Hill bemerkte jedoch, dass "... das Fehlen solcher [Labor-] Beweise die epidemiologische Wirkung auf Assoziationen nicht zunichte machen kann". Experiment : "Gelegentlich ist es möglich, auf experimentelle Beweise zurückzugreifen". Analogie : Die Wirkung ähnlicher Faktoren kann berücksichtigt werden.


Dies wurde vor etwa 50 Jahren vor dem Aufkommen randomisierter Studien formuliert (die für Ihr Fachgebiet möglicherweise nicht von Interesse sind). Es ist jedoch bemerkenswert, dass Experimente bei den Hill-Kriterien keine entscheidende Rolle spielten.

Ich würde gerne glauben, dass Beobachtungsdaten, wenn sie mit geeigneten statistischen Methoden analysiert werden, Rückschlüsse auf die Kausalität zulassen. (Dies hängt natürlich von vielen Faktoren ab.) In meinem Bereich ist es jedoch selten, dass bei einer Änderung des Patientenmanagements Richtlinien angezeigt werden, die von anderen als randomisierten Studien geprägt sind, und der Auftakt zu Richtlinien unterstreicht häufig, dass eine bestimmte Kausalität nur möglich ist in randomisierten Studien erhalten.

Jetzt weiß ich, dass viele von Ihnen mir nicht zustimmen werden. Ich stimme mir auch nicht zu. Aber es könnte zu einer Diskussion beitragen.

Adam Robinsson
quelle
"(was für Ihr Fachgebiet möglicherweise nicht von Interesse ist)" Mein Interesse gilt der algebraischen Geometrie und Arithmetik. Welches ist so weit von der Statistik entfernt, wie man sich vorstellen kann. Ich frage es nur aus Neugier.
Nicolas Bourbaki
2

Die Statistik bietet Tools zum Erkennen und Modellieren von Regelmäßigkeiten in den Daten. Der Modellierungsprozess wird in der Regel vom Fachwissen geleitet. Wenn das Modell den Subjektmechanismus darstellt, zeigen statistische Eigenschaften des geschätzten Modells, ob die Daten mit dem modellierten Mechanismus nicht übereinstimmen. Dann wird auf Kausalität (oder deren Fehlen) geschlossen - und dies geschieht auf der Themendomäne .

xy

xy





Richard Hardy
quelle
0

Die Frage geht derzeit davon aus, dass die Größen korreliert sind, was impliziert, dass die Person, die die Korrelation bestimmt, guten Grund zu der Annahme haben muss, dass die Variablen eine lineare Beziehung haben.

Die Granger-Kausalität ist möglicherweise das beste Instrument zur Bestimmung linearer Kausalzusammenhänge. Granger war ein Ökonom, der für seine Arbeit über lineare Verursachung einen Nobelpreis erhielt.

{Xt(i)}i=1kYt

  1. Die Ursache sollte vor der Wirkung auftreten.
  2. Die Ursache sollte Informationen über den Effekt enthalten, die sonst nicht verfügbar sind.

X.=[X.t- -1(1),X.t- -2(1),,X.t- -m(1),X.t- -1(2),X.t- -2(2),,X.t- -m(2),,X.t- -m(k)]]T.Y.=[Y.t- -1,Y.t- -2,,Y.t- -m]]T.mmm

Y.t=EINY.+ϵtY.t=EIN'[Y.,X.]]T.+ϵt'.
X.t- -ich(j)Y.tϵtϵt'

Z.t(1),,Z.t(p)Z.=[Z.t- -1(1),Z.t- -2(1),,Z.t- -m(p)]]T.

Y.t=EIN[Y.,Z.]]T.+ϵtY.t=EIN'[Y.,X.,Z.]]T.+ϵt'.

Dies ist nur eine grobe Skizze, und ich glaube, dass viele Autoren diese Idee verbessert haben.

Cantorhead
quelle
Willkommen auf der Website @cantorhead. Wir möchten, dass (Fragen und) Antworten hier in sich geschlossen sind. Es wäre besser, wenn Sie versuchen würden, "hier genauer zu sein" und nicht nur Google GC vorschlagen würden.
Gung - Reinstate Monica
0

Sie können nicht - zumindest nicht innerhalb der Statistik.

Maxim: Man kann nie sicher wissen, dass der Effekt einer Variablen von einer anderen verursacht wird. Der Grund: Sie können nie wissen, ob es keine andere Variable gibt, die Sie nicht kennen, und die von Ihnen gesammelten Daten können es Ihnen unmöglich sagen.

Tatsache ist, dass die Datenerfassung nicht immer ausreicht, wenn Daten statisch sind und das Phänomen dynamisch ist - wie menschliches Verhalten. Dort kann die Datenerfassung selbst die Ergebnisse verzerren, genau wie in der Teilchenphysik die Tatsache der Beobachtung selbst nicht aus der Gleichung entfernt werden kann.

Marcos
quelle