Es gibt ein altes Sprichwort: "Korrelation bedeutet nicht Verursachung". Wenn ich unterrichte, neige ich dazu, die folgenden Standardbeispiele zu verwenden, um diesen Punkt zu veranschaulichen:
- Störchenzahl und Geburtenrate in Dänemark;
- Anzahl der Priester in Amerika und Alkoholismus;
- Zu Beginn des 20. Jahrhunderts wurde festgestellt, dass eine starke Korrelation zwischen der Anzahl der Radiosender und der Anzahl der Menschen in Irrenanstalten besteht.
- und mein Favorit: Piraten verursachen globale Erwärmung .
Ich habe jedoch keine Referenzen für diese Beispiele und obwohl sie amüsant sind, sind sie offensichtlich falsch.
Hat jemand noch andere gute Beispiele?
correlation
teaching
csgillespie
quelle
quelle
Antworten:
Es könnte nützlich sein zu erklären, dass "Ursachen" eine asymmetrische Beziehung ist (X bewirkt, dass Y von Y Ursachen X verschieden ist), während "korreliert mit" eine symmetrische Beziehung ist.
Obdachlose Bevölkerung und Kriminalitätsrate könnten zum Beispiel dahingehend korreliert sein, dass beide an denselben Orten hoch oder niedrig sind. Es ist ebenso gültig zu sagen, dass die Obdachlosenbevölkerung mit der Kriminalitätsrate korreliert oder die Kriminalitätsrate mit der Obdachlosenbevölkerung korreliert. Zu sagen, dass Kriminalität Obdachlosigkeit verursacht oder obdachlose Bevölkerungsgruppen Kriminalität verursachen, ist eine andere Aussage. Und die Korrelation impliziert nicht, dass beides wahr ist. Zum Beispiel könnte die zugrunde liegende Ursache eine dritte Variable sein, wie etwa Drogenmissbrauch oder Arbeitslosigkeit.
Die Mathematik der Statistik ist nicht gut darin, zugrunde liegende Ursachen zu identifizieren, was eine andere Form der Beurteilung erfordert.
quelle
Meine Favoriten:
1) Je mehr Feuerwehrmänner ins Feuer geschickt werden, desto mehr Schaden wird angerichtet.
2) Kinder, die unterrichtet werden, erhalten schlechtere Noten als Kinder, die nicht unterrichtet werden
und (das ist meine oberste)
3) In den frühen Grundschuljahren korreliert das astrologische Zeichen mit dem IQ, aber diese Korrelation schwächt sich mit dem Alter ab und verschwindet mit dem Erwachsenenalter.
quelle
Ich habe diesen schon immer gemocht:
Quelle: http://pubs.acs.org/doi/abs/10.1021/ci700332k
quelle
Manchmal reicht die Korrelation aus. In der Kfz-Versicherung sind beispielsweise männliche Fahrer häufiger mit Unfällen konfrontiert, sodass Versicherungsunternehmen höhere Gebühren erheben. Es gibt keine Möglichkeit, dies tatsächlich auf Verursachung zu testen. Sie können das Geschlecht der Fahrer nicht experimentell ändern. Google hat Hunderte von Milliarden Dollar verdient, ohne sich um die Schadensursache zu kümmern.
Um eine Ursache zu finden, benötigen Sie im Allgemeinen experimentelle Daten, keine Beobachtungsdaten. Obwohl sie in der Wirtschaft häufig beobachtete "Erschütterungen" des Systems verwenden, um die Ursachen zu prüfen, z. B. wenn ein CEO plötzlich stirbt und der Aktienkurs steigt, können Sie von einer Ursache ausgehen.
Korrelation ist eine notwendige, aber nicht ausreichende Bedingung für die Verursachung. Um Kausalität zu zeigen, ist Kontrafaktik erforderlich.
quelle
Ich habe ein paar Beispiele, die ich gerne verwende.
Bei der Untersuchung der Kriminalitätsursache in New York in den 80er Jahren, als sie versuchten, die Stadt aufzuräumen, stellte ein Wissenschaftler eine starke Korrelation zwischen der Menge der begangenen schweren Kriminalität und der Menge der von Straßenhändlern verkauften Eiscreme fest! (Was ist die Ursache und was ist die Wirkung?) Offensichtlich gab es eine unbeobachtete Variable, die beides verursachte. Im Sommer ist die Kriminalität am größten und das meiste Eis wird verkauft.
Die Größe Ihrer Handfläche hängt negativ davon ab, wie lange Sie (wirklich!) Leben werden. Tatsächlich neigen Frauen dazu, kleinere Handflächen zu haben und länger zu leben.
[Mein Favorit] Ich habe vor einigen Jahren von einer Studie gehört, in der festgestellt wurde, dass die Menge an Soda, die eine Person trinkt, positiv mit der Wahrscheinlichkeit von Fettleibigkeit korreliert.(Ich sagte mir, das macht Sinn, da es daran liegen muss, dass die Leute das zuckerhaltige Soda trinken und all diese leeren Kalorien bekommen.) Ein paar Tage später kamen weitere Details heraus. Fast die gesamte Korrelation beruhte auf einem erhöhten Konsum von Diät-Erfrischungsgetränken. (Das hat meine Theorie durchgebrannt!) Also, wie ist die Ursache? Verursachen die Diät-Erfrischungsgetränke eine Gewichtszunahme oder führt eine Gewichtszunahme zu einem erhöhten Konsum von Diät-Erfrischungsgetränken? (Bevor Sie zu dem Schluss kommen, dass es sich um letzteres handelt, lesen Sie die Studie, in der kontrollierte Versuche mit Ratten zeigten, dass die Gruppe, der ein Joghurt mit künstlichem Süßstoff verabreicht wurde, an Gewicht zunahm als die Gruppe, der der normale Joghurt verabreicht wurde.) Zwei Referenzen: Drink More Diet Soda , Mehr Gewicht gewinnen? ; Diät-Limonaden im Zusammenhang mit Fettleibigkeit. Ich denke, sie versuchen immer noch, dies zu klären.
quelle
Die Anzahl der von einem Land gewonnenen Nobelpreise (bevölkerungsbereinigt) korreliert gut mit dem Pro-Kopf-Schokoladenkonsum. ( New England Journal of Medicine )
quelle
Obwohl es eher ein Beispiel für das Problem der Mehrfachvergleiche ist, ist es auch ein gutes Beispiel für eine falsch zugeschriebene Kausalität:
Rugby (die Religion von Wales) und sein Einfluss auf die katholische Kirche: Sollte sich Papst Benedikt XVI Sorgen machen?
quelle
Es gibt zwei Aspekte dieses Post-Hoc- Problems, die ich gerne abdecken möchte: (i) umgekehrte Kausalität und (ii) Endogenität
Ein Beispiel für eine "mögliche" umgekehrte Kausalität: Soziales Trinken und Einkommen - Trinker verdienen laut Bethany L. Peters und Edward Stringham (2006) mehr Geld. "No Booze? Sie könnten verlieren: Warum Trinker mehr Geld verdienen als Nicht-Trinker", Journal of Labour Research, Transaction Publishers, Band 27 (3), Seiten 411-421, Juni). Oder trinken Menschen, die mehr Geld verdienen, mehr, weil sie ein größeres verfügbares Einkommen haben oder weil sie unter Stress stehen? Dies ist ein großartiges Papier, das aus den verschiedensten Gründen diskutiert werden kann, einschließlich Messfehler, Antwortverzerrung, Kausalität usw.
Ein Beispiel für "mögliche" Endogenität: Die Fleischwolfgleichung erklärt die Log-Einnahmen durch Bildung, Erfahrung und Erfahrung im Quadrat. Es gibt eine lange Literatur zu diesem Thema. Arbeitsökonomen möchten den kausalen Zusammenhang zwischen Bildung und Einkommen abschätzen, aber Bildung ist möglicherweise endogen, da "Fähigkeit" das Bildungsniveau eines Einzelnen erhöhen (indem die Kosten für den Erwerb gesenkt werden) und ungeachtet dessen zu einer Steigerung des Einkommens führen könnte das Bildungsniveau. Eine mögliche Lösung hierfür könnte eine instrumentelle Variable sein. Das Buch von Angrist und Pischke, Mostly Harmless Econometrics, behandelt dies und thematisiert es sehr detailliert und klar.
Andere alberne Beispiele, für die ich keine Unterstützung habe, sind: - Anzahl der Fernseher pro Kopf und die Anzahl der Sterblichkeitsraten. Senden wir also Fernsehgeräte in Entwicklungsländer. Offensichtlich sind beide endogen für so etwas wie das BIP. - Anzahl der Haiangriffe und Eisverkäufe. Beides ist für die Temperatur vielleicht endogen?
Ich erzähle auch gerne den schrecklichen Witz über die Verrückten und die Spinne. Ein Irrer läuft mit einer Spinne, die er in der Hand hält, durch die Gänge einer Irrenanstalt. Er sieht den Arzt und sagt: "Guck mal Doc, ich kann mit Spinnen reden. Pass auf." Spinne, geh nach links! "Die Spinne bewegt sich ordnungsgemäß nach links. Er fährt fort:" Spinne, geh nach rechts. "Die Spinne schlurft zu der Der Arzt antwortet: „Interessant, vielleicht sollten wir in der nächsten Gruppensitzung darüber sprechen.“ Die verrückten Erwiderungen: „Das ist nichts, Doc. Pass auf. “Er zieht nacheinander die Beine der Spinne ab und schreit dann:„ Spinne, geh nach links! “Die Spinne liegt regungslos auf seiner Handfläche und der Verrückte dreht sich zum Arzt und schließt:„ Wenn du einer Spinne die Beine abziehst Beine wird er taub werden. "
quelle
Das Beste, was mir beigebracht wurde, war die Anzahl der Ertrinkungen und der Verkauf von Eiscreme kann stark korrelieren, aber das bedeutet nicht, dass eines das andere verursacht. Ertrinken und Eisverkauf sind in den Sommermonaten bei gutem Wetter offensichtlich höher. Dritte Variable aka gutes Wetter verursacht sie.
quelle
Als Verallgemeinerung von 'Piraten verursachen globale Erwärmung': Wählen Sie zwei Größen, die (monoton) mit der Zeit zunehmen oder abnehmen, und Sie sollten eine gewisse Korrelation sehen.
quelle
Sie können ein paar Minuten bei Google Correlate verbringen und alle Arten von falschen Korrelationen finden.
quelle
Ich arbeite mit Schülern im Unterrichten von Korrelation vs. Kausalität in meinen Algebra One-Klassen. Wir untersuchen viele mögliche Beispiele. Ich fand den Artikel Gebündelte Babys und gefährliches Eis: Korrelationsrätsel des Mathematiklehrers vom Februar 2013 nützlich. Ich mag die Idee, von "lauernden Variablen" zu sprechen. Auch dieser Cartoon ist ein süßer Gesprächsstarter:
Wir identifizieren die unabhängige und abhängige Variable im Cartoon und sprechen darüber, ob dies ein Beispiel für eine Kausalität ist, wenn nicht, warum nicht.
quelle
Ich habe (vor langer Zeit) ein interessantes Beispiel über einen Rückgang der Geburtenraten (oder Fruchtbarkeitsraten, wenn Sie diese Maßnahme bevorzugen) gelesen, insbesondere in den USA, beginnend in den frühen 1960er Jahren, als die Atomwaffentests ein Allzeithoch erreichten (1961 wurde die größte jemals gezündete Atombombe in der UdSSR getestet). Die Zinsen sanken weiter, bis die meisten Länder gegen Ende des 20. Jahrhunderts aufhörten, dies zu tun.
Ich kann keine Referenz finden, die diese Zahlen jetzt kombiniert, aber dieser Wikipedia-Artikel enthält Zahlen zu Atomwaffentests nach Ländern.
Natürlich könnte es sinnvoller sein, die Korrelation der Geburtenrate mit der Einführung und Legalisierung der Antibabypille 'zufällig' ab den frühen 1960er Jahren zu untersuchen. (In nur einigen Staaten zuerst, dann alle Staaten nur für verheiratete Frauen, dann einige für unverheiratete, dann auf ganzer Linie), aber auch das könnte nur ein Teil der Ursache sein; Viele andere Aspekte der Gleichstellung, wirtschaftliche Veränderungen und andere Faktoren spielen eine wichtige Rolle.
quelle
Eine Korrelation allein kann niemals einen Kausalzusammenhang herstellen. David Hume (1771-1776) argumentierte ziemlich effektiv, dass wir ein gewisses Wissen über die Kauasalität nicht mit rein empirischen Mitteln erlangen können . Kant hat versucht, das anzusprechen, die Wikipedia-Seite für Kant scheint es ganz gut zusammenzufassen:
Mit anderen Worten, Hume sagt uns, dass wir niemals wissen können, dass ein Kausalzusammenhang existiert, wenn wir nur eine Korrelation beobachten, aber Kant schlägt vor, dass wir unseren Grund verwenden können, um zwischen Korrelationen zu unterscheiden, die einen Kausalzusammenhang implizieren, und solchen, die dies nicht tun. Ich glaube nicht, dass Hume anderer Meinung gewesen wäre, solange Kant eher nach Plausibilität als nach bestimmten Kenntnissen schrieb.
Kurz gesagt, eine Korrelation liefert Indizien, die einen Kausalzusammenhang implizieren, aber das Gewicht der Indizien hängt stark von den jeweiligen Umständen ab, und wir können niemals absolut sicher sein. Die Fähigkeit, die Auswirkungen von Interventionen vorherzusagen, ist ein Weg, um Vertrauen zu gewinnen (wir können nichts beweisen, aber wir können es durch Beobachtungsbeweise widerlegen, also haben wir zumindest versucht, die Theorie eines Kausalzusammenhangs zu verfälschen). Ein einfaches Modell zu haben, das erklärt, warum wir eine Korrelation beobachten sollten, die auch andere Beweisformen erklärt, ist eine andere Möglichkeit, unsere Argumentation anzuwenden, wie Kant vorschlägt.
Vorbehalt: Es ist durchaus möglich, dass ich die Philosophie falsch verstanden habe, es bleibt jedoch der Fall, dass eine Korrelation niemals einen Beweis für einen Kausalzusammenhang liefern kann.
quelle
quelle
Ein neuer Parameter für die Sexualerziehung , Nature 332, 495 (7. April 1988), ist das Standardzitat, das auf die Korrelation zwischen der Zahl der Neugeborenen und Brutpaaren von Störchen in Westdeutschland hinweist . doi: 10.1038 / 332495a0
quelle
Die Spermienzahl bei Männern in slowenischen Dörfern und die Anzahl der Bären (auch in Slowenien) zeigen eine negative Korrelation. Einige Leute finden das sehr beunruhigend. Ich werde versuchen, die Studie zu bekommen, die das getan hat.
quelle
Ich war kürzlich auf einer Konferenz und einer der Redner gab dieses sehr interessante Beispiel (obwohl es darum ging, etwas anderes zu veranschaulichen):
Amerikaner und Engländer essen viel Fett. In den USA und im Vereinigten Königreich gibt es eine hohe Rate an Herz-Kreislauf-Erkrankungen.
Franzosen essen viel Fett, haben aber eine geringe Rate an Herz-Kreislauf-Erkrankungen.
Amerikaner und Engländer trinken viel Alkohol. In den USA und im Vereinigten Königreich gibt es eine hohe Rate an Herz-Kreislauf-Erkrankungen.
Italiener trinken viel Alkohol, haben aber auch hier eine geringe Rate an Herz-Kreislauf-Erkrankungen.
Das Fazit? Iss und trink was du willst. Und wenn Sie Englisch sprechen, haben Sie eine höhere Wahrscheinlichkeit, einen Herzinfarkt zu bekommen!
quelle
Dieser Cartoon von XKCD wird auch an anderer Stelle bei CrossValidated veröffentlicht.
quelle
Ein weiteres Beispiel für die Korrelation, die ich verwendet habe, ist die große Zunahme von Menschen, die Bio-Lebensmittel essen, und die Zunahme von Kindern, bei denen in den USA Autismus diagnostiziert wird.
quelle
http://tylervigen.com/
Dies zeigt eine Menge Korrelationen, die offensichtlich nichts mit Kausalität zu tun haben - oder haben Sie eine gute Vorstellung davon, wie die Korrelation von Age of Miss America mit Morden durch Dampf, heiße Dämpfe und heiße Gegenstände zustande kommt?
??
quelle
"Korrelation heißt nicht Kausalität" zu lehren, hilft niemandem wirklich, da letztendlich alle deduktiven Argumente teilweise auf Korrelation beruhen.
Menschen sind sehr schlecht darin zu lernen, etwas nicht zu tun.
Das Ziel sollte eher konstruktiv sein: Denken Sie immer an Alternativen zu Ihren Ausgangsannahmen, die dieselben Daten liefern könnten.
quelle
Nun, mein Prof. hat diese in der Einführungswahrscheinlichkeitsklasse verwendet:
1) Die Schuhgröße hängt mit der Lesefähigkeit zusammen
2) Der Haiangriff ist mit dem Verkauf von Speiseeis verbunden.
quelle
Je mehr Feuerwehrautos ins Feuer geschickt werden, desto größer ist der Schaden.
quelle
Ich denke, ein besseres Paradigma könnte sein, dass Kausalität eine Korrelation erfordert, die mit einem glaubwürdigen und vorzugsweise nachgewiesenen Mechanismus verbunden ist. Ich denke, das Wort implizieren sollte in diesem Zusammenhang sehr sparsam verwendet werden, da es mehrere Bedeutungen hat, einschließlich der des Vorschlags.
quelle
Das Störche-Beispiel befindet sich auf Seite 8 der ersten Ausgabe (1978) von Box, Hunter & Hunter's Buch mit dem Titel "Statistics for Experimenters ..." (Wiley). Ich weiß nicht, ob es in der 2. Auflage ist. Sie identifizieren die Stadt als Oldenburg und den Zeitraum 1930-1936.
Sie beziehen sich auf Ornithologische Monatsberichte , 44 , Nr. 2, Jahrgang, 1936, Berlin und 48 , Nr. 1, Jahrgang, 1940, Berlin und Statistiches Jahrbuch Deutscher Gemeinden , 27-33, 1932-1938, Gustav Fischer, Jena.
quelle
Ich habe in einem Artikel einen lustigen gesehen.
Die Butterproduktion in Bangladesch weist eine der höchsten Korrelationen mit dem S & P 500 über einen Zeitraum von zehn Jahren auf.
quelle
Hier ist eine perfekte. Und leider kann es als großartiger Lehrpunkt verwendet werden, da weder die Mitarbeiter der Washington Post noch die Zentren für Krankheitskontrolle und Prävention den Verdacht haben, dass der Artikel in The Onion ein Satire-Stück sein sollte.
https://www.washingtonpost.com/health/trumps-presidency-may-be-making-latinos-sick/2019/07/19/4e89b9f0-a97f-11e9-9214-246e594de5d5_story.html?utm_term=.9dd329c2e837
quelle
Jemand sagte, Korrelation bedeutet vielleicht nicht Verursachung, aber es kann sicherlich ein guter Hinweis sein :)
Ok, abgesehen von dem lustigen Teil, was genau ist Kausalität? Sind wir wirklich sicher, dass Piraten keine globale Erwärmung verursachen?
Kontraintuitiv, aber was als Ursache und was als Wirkung aufgefasst wird (in einer Korrelationsstudie ist das nicht so klar). Natürlich können viele Male beide nur Auswirkungen einer gemeinsamen Ursache sein (und damit korrelieren)
Es läuft alles auf die Methode zur Bestimmung der Kausalität hinaus.
Dies ist die Ursache (Wortspiel beabsichtigt) des Sprichworts:
Es gibt kleine Lügen. Es gibt große Lügen und es gibt Statistiken.
quelle