Ich hatte gerade eine Prüfung, bei der uns zwei Variablen präsentiert wurden. In einem Diktatorspiel, in dem ein Diktator 100 USD erhält und wählen kann, wie viel er senden oder behalten möchte, bestand eine positive Korrelation zwischen dem Alter und dem Betrag, den die Teilnehmer behalten wollten.
Meiner Meinung nach kann man daraus keine Kausalität ableiten, weil man die Kausalität nicht aus der Korrelation ableiten kann. Mein Klassenkamerad meint, dass Sie das können, denn wenn Sie zum Beispiel die Teilnehmer in drei separate Gruppen aufteilen, können Sie sehen, wie unterschiedlich sie sich in Bezug auf die Menge und den Anteil der Teilnehmer sind, und daraus schließen, dass das Alter dazu führt, dass sie mehr behalten. Wer ist richtig und warum?
quelle
Antworten:
Im Allgemeinen sollten Sie nicht davon ausgehen, dass Korrelation Kausalität impliziert - auch in Fällen, in denen dies der einzig mögliche Grund zu sein scheint.
Bedenken Sie, dass es andere Dinge gibt, die mit den altersgenerationellen Aspekten der Kultur zusammenhängen, zum Beispiel. Vielleicht bleiben diese drei Gruppen gleich, auch wenn sie alle älter werden, aber die nächste Generation wird sich dem Trend widersetzen?
Trotzdem haben Sie wahrscheinlich Recht, dass jüngere Menschen mit größerer Wahrscheinlichkeit eine größere Menge behalten, aber seien Sie sich nur bewusst, dass es andere Möglichkeiten gibt.
quelle
Ich kann mehrere Kausalitäten aus Ihren Daten postulieren .
Das Alter wird gemessen und dann der Geldbetrag aufbewahrt. Ältere Teilnehmer bevorzugen es, mehr Geld zu behalten (vielleicht sind sie schlauer oder weniger idealistisch, aber darum geht es nicht).
Die Menge des gehaltenen Geldes wird gemessen und dann das Alter. Menschen, die mehr Geld behalten, verbringen mehr Zeit damit, es zu zählen, und sind daher älter, wenn das Alter gemessen wird.
Kranke Menschen behalten mehr Geld, weil sie Geld für (möglicherweise lebensrettende) Medikamente oder Behandlungen benötigen. Die tatsächliche Korrelation besteht zwischen Krankheit und Geld, aber diese Variable ist "verborgen", und wir springen daher zu einer falschen Schlussfolgerung, da Alter und Wahrscheinlichkeit einer Krankheit in der für das Experiment ausgewählten demografischen Gruppe von Personen korrelieren.
(Auslassen von 143 Theorien; ich muss dies einigermaßen kurz halten.)
Fazit: Sie haben Recht, aber Ihr Klassenkamerad behauptet möglicherweise, 147-mal korrekter zu sein.
Eine andere berühmte Korrelation besteht zwischen einem niedrigen IQ und den Stunden, die täglich ferngesehen werden. Macht Fernsehen einen dumm, oder sehen dumme Leute mehr Fernsehen? Es könnte sogar beides sein.
quelle
Die Schlussfolgerung der Ursache aus der Korrelation im Allgemeinen ist problematisch, da es eine Reihe anderer Gründe für die Korrelation geben kann. Beispielsweise können falsche Korrelationen aufgrund von Störfaktoren , Auswahlverzerrungen (z. B. nur die Auswahl von Teilnehmern mit einem Einkommen unter einer bestimmten Schwelle) oder der Kausaleffekt einfach in die andere Richtung gehen (z. B. ein Thermometer ist mit der Temperatur korreliert, verursacht aber mit Sicherheit keine es). In jedem dieser Fälle kann das Verfahren Ihres Klassenkameraden eine kausale Wirkung haben, wenn es keine gibt.
Wenn die Teilnehmer jedoch nach dem Zufallsprinzip ausgewählt würden, könnten Störfaktoren und Auswahlfehler ausgeschlossen werden. In diesem Fall entweder Alter muss verursachen Geld gehalten oder Geld gehalten Muss Ursache Alter . Letzteres würde bedeuten, dass jemand gezwungen würde, einen bestimmten Geldbetrag zu behalten, um sein Alter zu ändern. Wir können also mit Sicherheit davon ausgehen, dass das Alter dazu führt, dass Geld gehalten wird .
Beachten Sie, dass der kausale Effekt "direkt" oder "indirekt" sein kann . Menschen unterschiedlichen Alters haben eine unterschiedliche Ausbildung erhalten, einen unterschiedlichen Wohlstand usw. und aus diesen Gründen könnten sie sich dafür entscheiden, einen unterschiedlichen Betrag von 100 US-Dollar beizubehalten. Kausale Effekte über diese Mediatoren sind immer noch kausale Effekte, aber indirekt.
quelle
Korrelation ist ein mathematischer Begriff; Kausalität ist eine philosophische Idee.
Andererseits ist die falsche Korrelation ein größtenteils technisches Konzept (Sie werden es nicht in Lehrbüchern für maßtheoretische Wahrscheinlichkeiten finden), das auf eine Weise definiert werden kann, die größtenteils umsetzbar ist.
Diese Idee steht in engem Zusammenhang mit der Idee des Fälschungismus in der Wissenschaft - wo es nie darum geht , Dinge zu beweisen , sondern sie nur zu widerlegen .
Statistik ist für Mathematik wie Medizin für Biologie. Sie werden gebeten, mit der Unterstützung einer Fülle von technischen Kenntnissen Ihr bestes Urteil zu fällen, aber dieses Wissen reicht nie aus, um die ganze Welt abzudecken. Wenn Sie also als Statistiker Urteile fällen und diese anderen präsentieren möchten, müssen Sie bestimmte Qualitätsstandards einhalten. Das heißt, dass Sie fundierte Ratschläge geben und sie auf ihre Kosten bringen. Dies bedeutet auch, dass die Asymmetrie der Risiken berücksichtigt werden muss. Bei medizinischen Tests können die Kosten für falsch negative Ergebnisse (die verhindern, dass Menschen frühzeitig behandelt werden) höher sein als die Kosten für falsch positive Ergebnisse (die zu Problemen führen). .
In der Praxis variieren diese Standards von Feld zu Feld - manchmal sind es dreifach blinde RCTs, manchmal sind es instrumentelle Variablen und andere Techniken zur Kontrolle auf Umkehrursachen und verborgene häufige Ursachen, manchmal ist es die Granger-Kausalität, mit der etwas in der Vergangenheit konsistent korreliert etwas anderes in der Gegenwart, aber nicht in umgekehrter Richtung. Es könnte sogar eine rigorose Regularisierung und gegenseitige Validierung sein.
quelle
Die Beziehung zwischen Korrelation und Kausalität hat Philosophen und Statistiker über Jahrhunderte hinweg gleichermaßen überrascht. Schließlich behaupten die Informatiker in den letzten rund zwanzig Jahren, alles geregelt zu haben. Dies scheint nicht allgemein bekannt zu sein. Glücklicherweise hat Judea Pearl, eine treibende Kraft auf diesem Gebiet, kürzlich ein Buch veröffentlicht, das diese Arbeit für ein populäres Publikum erklärt: The Book of Why.
https://www.amazon.com/Book-Why-Science-Cause-Effect/dp/046509760X
https://bigthink.com/errors-we-live-by/judea-pearls-the-book-of-brings-news-of-a-new-science-of-causes
Spoiler-Alarm: Unter bestimmten Umständen können Sie aus der Korrelation eine Kausalität ableiten, wenn Sie wissen, was Sie tun. Sie müssen zunächst einige kausale Annahmen treffen (ein Kausalmodell, das im Idealfall auf wissenschaftlichen Erkenntnissen basiert). Und Sie brauchen die Werkzeuge, um kontrafaktisches Denken zu betreiben (Die Do-Algebra). Es tut mir leid, dass ich das nicht auf ein paar Zeilen reduzieren kann (ich lese das Buch immer noch selbst), aber ich denke, die Antwort auf Ihre Frage ist da drin.
quelle
Ein kausaler Altersanspruch wäre in diesem Fall unangemessen
Das Problem mit der Behauptung der Kausalität in Ihrem Prüfungsfragenentwurf kann auf eine einfache Tatsache zurückgeführt werden: Altern war keine Behandlung, Alter wurde überhaupt nicht manipuliert. Der Hauptgrund für kontrollierte Studien liegt gerade darin, dass man aufgrund der Manipulation und Kontrolle der interessierenden Variablen sagen kann, dass die Änderung einer Variablen die Änderung des Ergebnisses verursacht (unter extrem spezifischen Versuchsbedingungen und mit einer Bootslast) von anderen Annahmen wie zufälliger Zuordnung und dass der Experimentator etwas in den Ausführungsdetails nicht vermasselt hat, was ich hier beiläufig beschreibe).
Aber das ist nicht das, was das Prüfungsdesign beschreibt - es hat einfach zwei Gruppen von Teilnehmern, mit einer spezifischen Tatsache, die sie unterscheidet (ihr Alter); Sie haben jedoch keine Möglichkeit, die anderen Arten der Gruppenunterschiede zu kennen. Aufgrund des Mangels an Kontrolle können Sie nicht wissen, ob es der Altersunterschied war, der das Ergebnis verändert hat, oder ob der Grund dafür, dass 40-Jährige an einer Studie teilnehmen, darin besteht, dass sie das Geld benötigen, während es 20-Jährige sind Schüler, die für ihre Klasse angerechnet wurden und daher unterschiedliche Motivationen hatten - oder einen von tausend anderen möglichen natürlichen Unterschieden in Ihrer Gruppe.
Die technische Terminologie für diese Art von Dingen variiert je nach Fachgebiet. Gemeinsame Begriffe für Dinge wie Alter und Geschlecht der Teilnehmer sind "Teilnehmerattribut", "Fremdvariable", "Attributunabhängige Variable" usw. Letztendlich haben Sie etwas, das kein "echtes Experiment" oder "echtes kontrolliertes Experiment" ist. weil die Sache, über die Sie eine Behauptung aufstellen möchten - wie das Alter - nicht wirklich in Ihrer Kontrolle war, um sich zu ändern, also das Beste, auf das Sie hoffen können, ohne weit fortgeschrittenere Methoden (wie kausale Folgerungen, zusätzliche Bedingungen, longitudinale Daten usw.) ist zu behaupten, es gibt eine Korrelation.
Dies ist auch einer der Gründe, warum Experimente in den Sozialwissenschaften und das Verstehen schwer kontrollierbarer Eigenschaften von Menschen in der Praxis so schwierig sind - Menschen unterscheiden sich in vielerlei Hinsicht und wenn man die gewünschten Dinge nicht ändern kann Um etwas zu lernen, benötigen Sie in der Regel komplexere experimentelle und inferentielle Techniken oder eine völlig andere Strategie.
Wie können Sie das Design ändern, um einen kausalen Anspruch geltend zu machen?
Stellen Sie sich ein hypothetisches Szenario wie dieses vor: Gruppe A und B setzen sich aus Teilnehmern zusammen, die 20 Jahre alt sind.
Sie lassen die Gruppe A wie gewohnt das Diktaturspiel spielen.
Für Gruppe B nehmen Sie einen Magical Aging Ray of Science (oder lassen Sie sich von einem Geist mit einem entsetzlichen Gesichtsausdruck behandeln ), den Sie sorgfältig darauf abgestimmt haben, alle Teilnehmer in Gruppe B zu altern, sodass sie jetzt 40 Jahre alt sind, aber Lassen Sie sie ansonsten unverändert und lassen Sie sie dann das Diktatorspiel spielen, so wie es Gruppe A getan hat.
Für zusätzliche Strenge könnten Sie eine Gruppe C von 40-Jährigen im natürlichen Alter erhalten, um zu bestätigen, dass das synthetische Altern mit dem natürlichen Altern vergleichbar ist. Lassen Sie uns jedoch die Dinge einfach halten und sagen, wir wissen, dass künstliches Altern genauso ist wie das, was auf "vor" basiert Arbeit".
Wenn Gruppe B mehr Geld als Gruppe A behält, können Sie behaupten, dass das Experiment darauf hinweist, dass die Menschen aufgrund des Alterns mehr Geld behalten. Natürlich gibt es immer noch ungefähr tausend Gründe, warum sich Ihre Behauptung als falsch herausstellen könnte, aber Ihr Experiment hat zumindest eine gültige kausale Interpretation.
quelle
Nein. Es gibt eine einseitige logische Beziehung zwischen Kausalität und Korrelation.
Betrachten Sie Korrelation als eine Eigenschaft, die Sie für einige Daten berechnen, z. B. die von Pearson definierte häufigste (lineare) Korrelation. Für diese spezielle Definition der Korrelation können Sie zufällige Datenpunkte erstellen, die eine Korrelation von Null oder Eins aufweisen, ohne dass eine Kausalität zwischen ihnen besteht, indem Sie lediglich bestimmte (a) Symmetrien aufweisen. Für jede Definition von Korrelation können Sie eine Vorschrift erstellen, die beide Verhaltensweisen zeigt: hohe Korrelationswerte ohne mathematische Beziehung dazwischen und niedrige Korrelationswerte, selbst wenn es einen festen Ausdruck gibt.
Ja, die Beziehung von "nicht verwandt, aber stark korreliert" ist schwächer als "keine Korrelation, obwohl sie verwandt ist". Der einzige Indikator (!), Den Sie haben, wenn eine Korrelation vorliegt, ist, dass Sie nach einer Erklärung dafür härter suchen müssen.
quelle
Im Allgemeinen kann man nicht von der Korrelation zur Kausalität springen. Zum Beispiel gibt es ein bekanntes sozialwissenschaftliches Phänomen in Bezug auf sozialen Status / Klasse und die Neigung zum Ausgeben / Sparen. Für viele viele Jahre wurde angenommen , dass diese Kausalität zeigte. Im vergangenen Jahr haben intensivere Untersuchungen gezeigt, dass dies nicht der Fall ist.
Klassische "Korrelation ist keine Kausalität" - in diesem Fall war der verwirrende Faktor, dass das Aufwachsen in Armut die Menschen lehrt, Geld anders zu verwenden und auszugeben, wenn es einen Überschuss gibt, weil es morgen möglicherweise nicht da ist, auch wenn es aus verschiedenen Gründen gespart wird .
Nehmen wir in Ihrem Beispiel an, die älteren Menschen haben alle einen Krieg durchlebt, was die jüngeren nicht getan haben. Die Verbindung könnte darin bestehen, dass Menschen, die im sozialen Chaos aufgewachsen sind und ein echtes Risiko für Schaden und Verlust von Menschenleben haben, lernen, Ressourcen für sich und gegen Not zu sparen, mehr als diejenigen, die unter glücklicheren Umständen aufwachsen, wo der Staat, die Arbeitgeber oder Krankenversicherer werden sich darum kümmern, und das Überleben ist kein Thema, das ihre Perspektiven geprägt hat. Dann bekäme man den gleichen offensichtlichen Zusammenhang - ältere Menschen (einschließlich derer, die näher an ihrer Generation sind) behalten mehr bei, aber es wäre nur scheinbar mit dem Alter verbunden. In Wirklichkeit ist das ursächliche Element die soziale Situation, in der man prägende Jahre verbracht hat, und welche Gewohnheiten das lehrte - nicht das Alter an sich .
quelle
Es gibt einige Gründe, warum diese Schlussfolgerung keinen Sinn ergibt.
Eine vorgeschlagene Verbesserung des Designs ist die folgende Cross-Over-Typ-Studie.
quelle
Kausalität und Korrelation sind verschiedene Kategorien von Dingen. Deshalb reicht die Korrelation allein nicht aus, um auf die Kausalität schließen zu können.
Zum Beispiel ist die Kausalität gerichtet , die Korrelation jedoch nicht. Wenn Sie auf Kausalität schließen, müssen Sie feststellen, was Ursache und was Wirkung ist.
Es gibt andere Dinge, die Ihre Schlussfolgerung stören könnten. Versteckte oder dritte Variable und alle Fragen der Statistik (Stichprobenauswahl, Stichprobengröße usw.)
Unter der Annahme, dass Ihre Statistiken ordnungsgemäß erstellt wurden, kann die Korrelation Hinweise auf die Kausalität geben. Wenn Sie eine Korrelation finden, bedeutet dies in der Regel, dass es irgendwo eine Art von Kausalität gibt, und Sie sollten anfangen, danach zu suchen.
Sie können mit einer Hypothese beginnen, die sich aus Ihrer Korrelation ergibt. Eine Hypothese ist jedoch keine Kausalität, sondern lediglich eine Möglichkeit der Kausalität. Sie müssen es dann testen. Wenn sich Ihre Hypothese ausreichenden Fälschungsversuchen widersetzt, sind Sie möglicherweise auf dem richtigen Weg.
In Ihrer Hypothese über die Ursachen von Altersgier wäre eine alternative Hypothese, dass es sich nicht um das Alter, sondern um die Dauer der Diktatur handelt. Sie würden also nach alten, aber kürzlich ermächtigten Diktatoren als Kontrollgruppe und nach jungen, aber seit ihrer Kindheit tätigen Diktatoren als zweite Gruppe suchen und die Ergebnisse dort überprüfen.
quelle
Vielen Dank an @AdamO für das Anbieten von Diskussionen und Streitpunkten zu diesem Beitrag. Ich versuche, eine physische Sicht der Kausalität zu bieten, die dem durchschnittlichen Leser von Statistiken möglicherweise unbekannt ist.
Sie haben physikalisch gesehen Recht. In der einfachsten Form ist die Möglichkeit einer physikalisch zeitunabhängigen Betrachtung der Kausalität die Grundlage der deduktiv-nomologischen (DN) Betrachtung der wissenschaftlichen Erklärung, wobei ein Ereignis zu erklären ist, wenn es nach einem wissenschaftlichen Gesetz subsumiert werden kann. In der DN-Sicht gilt ein physikalischer Zustand als erklärt, wenn er sich unter Anwendung des (deterministischen) Gesetzes aus gegebenen Ausgangsbedingungen ableiten lässt. (Solche Anfangsbedingungen können die Momente und Abstände von Doppelsternen zu jedem gegebenen Zeitpunkt einschließen.) Eine solche "Erklärung durch Determinismus" wird manchmal als kausaler Determinismus bezeichnet.
Um dies etwas vollständiger zu machen, würde man das induktiv-statistische Modell von Hempel einbeziehen, um eine wissenschaftliche Erklärung zu bilden , die eine vollständigere Diskussion der Kausalität bietet.
Was das vorliegende Problem betrifft, kann das Alter mit der Erfahrung in Beziehung gesetzt werden, aber die Beziehung ist nicht einfach. Darüber hinaus ist die Gehirnfunktion in verschiedenen Altersstufen unterschiedlich (die zeitliche Abgrenzung dehnt sich mit dem Alter aus). Die Erfahrung als Modifikator des Verhaltens ist sehr unterschiedlich, und nur weil eine Kohorte in einem bestimmten territorialen und zeitlichen Sinne ähnliche historische Erfahrungen haben kann, bedeutet dies nicht, dass jedes Verhalten, das aus diesen Erfahrungen resultiert, ohne Angst vor Widersprüchen auf andere Kohorten extrapoliert werden kann. In Bezug auf einen kontrollierten Versuch ist die Gemeinsamkeit von Erfahrungen eine unkontrollierte Variable, die eine unbekannte und unerforschte Menge an falschen Korrelationen in jeden binären Vergleich einführt, so dass jeder festgestellte Unterschied nicht als Aufdeckung eines wahrscheinlich kausalen Zusammenhangs angesehen werden sollte. Darüber hinaus ist eine wahrscheinliche Ursache, wenn gefunden, würde nur einen Verdacht darstellen und nichts, was man mit Überzeugung sagen kann; es ist bestenfalls eine Arbeitshypothese, keine beste Schlussfolgerung. Überzeugungen in Bezug auf die Kausalität sollten nur aus einer Reihe von Beweisen gezogen werden, die so umfassend sind, dass diese Überzeugungen zweifelsfrei sind. Dies ist bei der obigen Frage nicht der Fall, für die es nicht genügend Informationen gibt, um einen Kausalzusammenhang über einen zufälligen Zusammenhang aus der Kohortengruppierung hinaus zu behaupten. Man kann in der Tat so viele Hypothesen formulieren, dass zum Beispiel die Entwicklung der Großzügigkeit mit dem Alter durch kulturhistorische Epochenerfahrungen modifiziert wird, dass aus dem genannten Problem keine festen Schlussfolgerungen gezogen werden können. Überzeugungen in Bezug auf die Kausalität sollten nur aus einer Reihe von Beweisen gezogen werden, die so umfassend sind, dass diese Überzeugungen zweifelsfrei sind. Dies ist bei der obigen Frage nicht der Fall, für die es nicht genügend Informationen gibt, um einen Kausalzusammenhang über einen zufälligen Zusammenhang aus der Kohortengruppierung hinaus zu behaupten. Man kann in der Tat so viele Hypothesen formulieren, dass zum Beispiel die Entwicklung der Großzügigkeit mit dem Alter durch kulturhistorische Epochenerfahrungen modifiziert wird, dass aus dem genannten Problem keine festen Schlussfolgerungen gezogen werden können. Überzeugungen in Bezug auf die Kausalität sollten nur aus einer Reihe von Beweisen gezogen werden, die so umfassend sind, dass diese Überzeugungen zweifelsfrei sind. Dies ist bei der obigen Frage nicht der Fall, für die es nicht genügend Informationen gibt, um einen Kausalzusammenhang über einen zufälligen Zusammenhang aus der Kohortengruppierung hinaus zu behaupten. Man kann in der Tat so viele Hypothesen formulieren, dass zum Beispiel die Entwicklung der Großzügigkeit mit dem Alter durch kulturhistorische Epochenerfahrungen modifiziert wird, dass aus dem genannten Problem keine festen Schlussfolgerungen gezogen werden können.
quelle