Ein Lieblingsspruch vieler Statistiker lautet: "Korrelation impliziert keine Kausalität." Dies ist sicherlich wahr, aber eine Sache, die hier impliziert zu sein scheint, ist, dass Korrelation wenig oder keinen Wert hat. Ist das wahr? Ist es sinnlos zu wissen, dass zwei Variablen miteinander korrelieren?
Ich kann mir nicht vorstellen, dass dies der Fall ist. Ich kenne mich mit Vorhersageanalysen nicht so gut aus, aber es scheint, als wäre X
es ein Prädiktor dafür Y
, zukünftige Werte Y
basierend auf vorherzusagen X
, unabhängig von der Kausalität.
Bin ich falsch darin, den Wert in der Korrelation zu sehen? Und wenn nicht, in welchen Situationen könnte ein Statistiker oder Datenwissenschaftler die Korrelation ohne Ursache verwenden?
correlation
predictive-models
causality
Indigenität
quelle
quelle
Antworten:
Die Korrelation (oder ein anderes Maß für die Assoziation) ist für die Vorhersage unabhängig von der Ursache nützlich. Angenommen, Sie messen eine eindeutige, stabile Zuordnung zwischen zwei Variablen. Dies bedeutet, dass Sie durch die Kenntnis des Pegels einer Variablen auch Informationen über eine andere interessierende Variable erhalten, mit deren Hilfe Sie eine Variable als Funktion der anderen vorhersagen und vor allem basierend auf dieser Vorhersage Maßnahmen ergreifen können . Das Ergreifen von Maßnahmen umfasst das Ändern einer oder mehrerer Variablen, z. B. beim Abgeben einer automatisierten Empfehlung oder beim Einsetzen eines medizinischen Eingriffs. Natürlich könnten Sie bessere Vorhersagen treffen und effektiver handeln, wenn Sie mehr Einblick in die direkten oder indirekten Beziehungen zwischen zwei Variablen hätten. Diese Einsicht kann andere Variablen umfassen, einschließlich räumlicher und zeitlicher.
quelle
A
ein sehr guter Prädiktor ist, ist es sehr verlockend zu behaupten, dass dies auch die Ursache der Krankheit ist - und wie in den Kommentaren erwähnt, ist es sehr leicht, zu falschen Schlussfolgerungen zu kommen. Wenn wir nur Vorhersagen treffen möchten, z. B. ob ein Patient an der Krankheit leidet oder nicht, gibt es keine Probleme mit Korrelationen.Hier gibt es bereits viele gute Punkte. Lassen Sie mich Ihre Behauptung auf den Punkt bringen, dass "wenn
X
ein Prädiktor von istY
, es nützlich wäre, zukünftige WerteY
basierend aufX
, unabhängig von der Kausalität, vorherzusagen ". Sie haben Recht: Wenn Sie nur ein Unbekanntes vorhersagen wollenY
Wert aus einem bekanntenX
Wert und einer bekannten, stabilen Beziehung der Kausalzustand dieser Beziehung irrelevant. Berücksichtige das:quelle
Die Bedeutung der Korrelation wird nicht in den Schatten gestellt. Es ist nur so, dass die Tendenz besteht, Korrelation als Kausalität zu interpretieren.
Nehmen Sie das Stillen als perfektes Beispiel. Mütter interpretieren die Ergebnisse (Beobachtungsstudien) zum Stillen fast immer als einen Hinweis darauf, ob sie tatsächlich stillen sollen oder nicht. Es ist richtig, dass Säuglinge, die gestillt werden, im Durchschnitt in der Regel gesündere Erwachsene sind, auch wenn sie das longitudinale mütterliche und väterliche Alter, den sozioökonomischen Status usw. kontrolliert haben. Dies bedeutet jedoch nicht, dass das Stillen allein für den Unterschied verantwortlich ist spielen teilweise eine Rolle bei der frühen Entwicklung der Appetitregulation. Die Beziehung ist sehr komplex und man kann leicht über eine ganze Reihe von Vermittlungsfaktoren spekulieren, die den beobachteten Unterschieden zugrunde liegen könnten.
Viele Studien konzentrieren sich auf Assoziationen, um ein tieferes Verständnis der Vorgänge zu gewährleisten. Korrelation ist nicht nutzlos, sie liegt nur einige Schritte unter der Kausalität, und man muss bedenken, wie Ergebnisse gemeldet werden, um Fehlinterpretationen von Nichtfachleuten zu vermeiden.
quelle
Sie haben Recht, dass Korrelation nützlich ist. Der Grund, warum Kausalmodelle besser sind als Assoziationsmodelle, ist, wie Pearl sagt, dass sie Orakel für Interventionen sind. Mit anderen Worten, sie ermöglichen es Ihnen, hypothetisch zu argumentieren. Ein Kausalmodell beantwortet die Frage: "Wenn ich X möglich machen würde, was würde mit Y geschehen?"
Aber Sie müssen nicht immer hypothetisch argumentieren. Wenn Ihr Modell nur zur Beantwortung von Fragen wie "Wenn ich X beobachte, was weiß ich über Y?" Verwendet wird, ist ein Assoziationsmodell alles, was Sie benötigen.
quelle
Sie haben Recht, dass die Korrelation für die Vorhersage nützlich ist. Dies ist auch hilfreich, um das zu untersuchende System besser zu verstehen.
Ein Fall, in dem Kenntnisse über den Kausalmechanismus erforderlich sind, besteht darin, dass die Zielverteilung manipuliert wurde (z. B. wurden einige Variablen "gezwungen", bestimmte Werte anzunehmen). Ein Modell, das nur auf Korrelationen basiert, wird schlecht abschneiden, während ein Modell, das kausale Informationen verwendet, viel besser abschneiden sollte.
quelle
Korrelation ist ein nützliches Werkzeug, wenn Sie ein zugrunde liegendes Modell haben, das die Kausalität erklärt.
Wenn Sie beispielsweise wissen, dass das Anwenden einer Kraft auf ein Objekt dessen Bewegung beeinflusst, können Sie die Korrelation zwischen Kraft und Geschwindigkeit sowie Kraft und Beschleunigung messen. Die stärkere Korrelation (mit der Beschleunigung) erklärt sich von selbst.
In Beobachtungsstudien kann die Korrelation bestimmte häufig vorkommende Muster (wie angegebenes Stillen und späterer Gesundheitszustand) aufdecken, die eine Grundlage für weitere wissenschaftliche Untersuchungen durch geeignete Versuchspläne bilden können, die die Kausalität bestätigen oder ablehnen können (z. B. statt Stillen als Ursache) die Konsequenz für einen bestimmten kulturellen Rahmen).
Korrelation kann also nützlich sein, kann aber selten schlüssig sein.
quelle
Wie Sie bereits sagten, ist die Korrelation allein von großem Nutzen, vor allem die Vorhersage.
Zum Beispiel sind all diese Studien, die zeigen, dass starker Kaffeekonsum bei älteren Menschen mit gesünderen Herz-Kreislauf-Systemen zusammenhängt, meines Erachtens zweifellos von Menschen motiviert, die ihre Gewohnheiten für starken Kaffee rechtfertigen wollen. Zu sagen, Kaffeetrinken sei nur mit einem gesünderen Herzen verbunden und nicht mit Kausalität, ist keine Antwort auf unsere eigentliche Frage des Interesses: Werden wir gesünder, wenn wir mehr Kaffee trinken oder wenn wir kürzen? Es kann sehr frustrierend sein, sehr interessante Ergebnisse zu finden (Kaffee ist mit gesünderen Herzen verbunden!), Aber nicht in der Lage zu sein, diese Informationen für Entscheidungen zu verwenden (ich weiß immer noch nicht, ob Sie Kaffee trinken sollten, um gesünder zu sein), und so gibt es fast immer eine Versuchung, Korrelation als Kausalität zu interpretieren.
Es sei denn, Sie interessieren sich nur für Glücksspiele (dh Sie möchten vorhersagen, aber nicht beeinflussen).
quelle
Es gibt einen Wert in der Korrelation, aber man sollte sich mehr Beweise ansehen, um auf die Ursache schließen zu können.
Vor Jahren gab es eine Studie, die zu "Kaffee verursacht Krebs" führte. Sobald ich das in den Nachrichten hörte, sagte ich meiner Frau "falsche Korrelation". Es stellte sich heraus, dass ich Recht hatte. Die Kaffeebevölkerung mit 2-3 Tassen pro Tag rauchte häufiger als die Nichtkaffeetrinker. Sobald die Datensammler dies herausgefunden hatten, zogen sie ihre Ergebnisse zurück.
Eine weitere interessante Studie vor dem Immobilienboom und der Immobilienpleite zeigte Rassismus bei der Bearbeitung von Hypotheken. Die Behauptung lautete, dass schwarze Bewerber häufiger abgelehnt wurden als weiße. Eine andere Studie befasste sich jedoch mit Ausfallraten. Schwarze Hausbesitzer waren mit der gleichen Rate wie Weiße in Verzug. Wenn die Schwarzapplikation auf einem höheren Standard gehalten würde, wäre ihre Ausfallrate tatsächlich viel niedriger. Hinweis: Diese Anekdote wurde von Autor Thomas Sowell in seinem Buch The Housing Boom and Bust geteilt
Mit Data Mining können problemlos zwei Datensätze erstellt werden, die eine hohe Korrelation aufweisen, jedoch für Ereignisse, die möglicherweise nicht miteinander in Beziehung stehen. Am Ende ist es am besten, Studien, die dir geschickt werden, mit einem sehr kritischen Auge zu betrachten. Das Auffinden falscher Korrelationen ist nicht immer einfach, es ist ein erworbenes Talent.
quelle
Korrelation ist ein beobachtbares Phänomen. Sie können es messen. Sie können auf diese Messungen einwirken. Allein kann es nützlich sein.
Wenn Sie jedoch nur eine Korrelation haben, können Sie nicht garantieren, dass eine von Ihnen vorgenommene Änderung tatsächlich durchgeführt wird Auswirkungen hat (siehe die berühmten Grafiken, die den Aufstieg von iPhones mit der Sklaverei in Übersee und dergleichen in Verbindung bringen). Es zeigt nur, dass es dort eine Korrelation gibt, und wenn Sie die Umgebung optimieren (indem Sie handeln), kann diese Korrelation immer noch vorhanden sein.
Dies ist jedoch ein sehr subtiler Ansatz. In vielen Szenarien möchten wir ein weniger subtiles Werkzeug haben: die Kausalität. Kausalität ist eine Korrelation in Verbindung mit der Behauptung, dass man erwarten sollte, wenn man seine Umgebung auf die eine oder andere Weise verändert die Korrelation weiterhin besteht . Dies ermöglicht eine längerfristige Planung, beispielsweise die Verkettung von 20 oder 50 kausalen Ereignissen in einer Reihe, um ein nützliches Ergebnis zu ermitteln. Dies mit 20 oder 50 Korrelationen zu tun, hinterlässt oft ein sehr verschwommenes und trübes Ergebnis.
Betrachten Sie als Beispiel dafür, wie nützlich sie in der Vergangenheit waren, die westliche Wissenschaft im Vergleich zur traditionellen chinesischen Medizin (TCM). Die westliche Wissenschaft konzentriert sich hauptsächlich auf "Entwickeln Sie eine Theorie, isolieren Sie einen Test, der die Theorie demonstrieren kann, führen Sie den Test durch und dokumentieren Sie die Ergebnisse." Dies beginnt mit "Entwickeln einer Theorie", die in hohem Maße mit der Kausalität verbunden ist. TCM drehte es herum und begann mit "Entwickeln eines Tests, der nützliche Ergebnisse liefern kann, Ausführen des Tests und Identifizieren von Korrelationen in der Antwort". Der Fokus liegt mehr auf Korrelationen.
Heutzutage tendieren Westler dazu, fast ausschließlich in Begriffen der Kausalität zu denken, weshalb es schwieriger ist, den Wert des Studiums der Korrelation auszuspionieren. Wir finden es jedoch in jedem Winkel unseres Lebens. Und vergessen Sie nie, dass Korrelationen auch in der westlichen Wissenschaft ein wichtiges Instrument sind, um herauszufinden, welche Theorien es wert sind, erforscht zu werden!
quelle