Beispiele für den Unterricht: Korrelation bedeutet nicht Kausalität

74

Es gibt ein altes Sprichwort: "Korrelation bedeutet nicht Verursachung". Wenn ich unterrichte, neige ich dazu, die folgenden Standardbeispiele zu verwenden, um diesen Punkt zu veranschaulichen:

  1. Störchenzahl und Geburtenrate in Dänemark;
  2. Anzahl der Priester in Amerika und Alkoholismus;
  3. Zu Beginn des 20. Jahrhunderts wurde festgestellt, dass eine starke Korrelation zwischen der Anzahl der Radiosender und der Anzahl der Menschen in Irrenanstalten besteht.
  4. und mein Favorit: Piraten verursachen globale Erwärmung .

Ich habe jedoch keine Referenzen für diese Beispiele und obwohl sie amüsant sind, sind sie offensichtlich falsch.

Hat jemand noch andere gute Beispiele?

csgillespie
quelle
2
Blättern Sie durch Freakonomics, um einige gute Beispiele zu finden. Ihre Bibliographie steckt voller Referenzen.
Stephen Turner
17
xkcd.com/552
Ami
5
Diese Piraten- / Klimaerwärmungstabelle wird eindeutig von Verschwörungstheoretikern erfunden - jeder kann sehen, dass sie absichtlich einen gleichmäßigen Abstand für ungleiche Zeiträume eingezeichnet haben, um den jüngsten starken Temperaturanstieg zu vermeiden, da Piraten fast vollständig ausgelöscht sind. Wir alle wissen, dass der Rum bei steigenden Temperaturen verdunstet und Piraten diese Bedingungen nicht überstehen können. ;-)
AdamV
4
WTF ist oben mit der X-Achse auf diesem Piratengraphen?
Naught101
1
Oder so ziemlich alles, was Sie in Google Correlate einfügen .
Conjugateprior

Antworten:

39

Es könnte nützlich sein zu erklären, dass "Ursachen" eine asymmetrische Beziehung ist (X bewirkt, dass Y von Y Ursachen X verschieden ist), während "korreliert mit" eine symmetrische Beziehung ist.

Obdachlose Bevölkerung und Kriminalitätsrate könnten zum Beispiel dahingehend korreliert sein, dass beide an denselben Orten hoch oder niedrig sind. Es ist ebenso gültig zu sagen, dass die Obdachlosenbevölkerung mit der Kriminalitätsrate korreliert oder die Kriminalitätsrate mit der Obdachlosenbevölkerung korreliert. Zu sagen, dass Kriminalität Obdachlosigkeit verursacht oder obdachlose Bevölkerungsgruppen Kriminalität verursachen, ist eine andere Aussage. Und die Korrelation impliziert nicht, dass beides wahr ist. Zum Beispiel könnte die zugrunde liegende Ursache eine dritte Variable sein, wie etwa Drogenmissbrauch oder Arbeitslosigkeit.

Die Mathematik der Statistik ist nicht gut darin, zugrunde liegende Ursachen zu identifizieren, was eine andere Form der Beurteilung erfordert.

Paul
quelle
3
Das Urteil ist ein gutes Wort, denn alles, was wir jemals beobachten können, ist Korrelation. Experimente und / oder clevere Statistiken ermöglichen es uns lediglich, einige alternative Erklärungen für die Ursachen auszuschließen.
Jonas
Sehr guter Kommentar zu den symmetrischen / asymmetrischen Beziehungen. Man könnte auch behaupten, dass durch die globale Erwärmung die Piraterie zunimmt.
Andre Holzner
27

Meine Favoriten:

1) Je mehr Feuerwehrmänner ins Feuer geschickt werden, desto mehr Schaden wird angerichtet.

2) Kinder, die unterrichtet werden, erhalten schlechtere Noten als Kinder, die nicht unterrichtet werden

und (das ist meine oberste)

3) In den frühen Grundschuljahren korreliert das astrologische Zeichen mit dem IQ, aber diese Korrelation schwächt sich mit dem Alter ab und verschwindet mit dem Erwachsenenalter.

Peter Flom
quelle
2
(@xmjx Geliefert das erste Beispiel im letzten Jahr.) Ich liebe das astrologische Beispiel.
whuber
Können Sie die Probe bitte mit einem Sternzeichen erklären?
Eugene D. Gubenkov
2
Egal, ich habe es verstanden. Das hat mit dem Altersunterschied zwischen den am Anfang des Jahres geborenen und den am Ende geborenen Kindern zu tun. Nett.
Eugene D. Gubenkov
24

Ich habe diesen schon immer gemocht:

Zitronen gegen Todesfälle

Quelle: http://pubs.acs.org/doi/abs/10.1021/ci700332k

chrisamiller
quelle
1
Nett, aber ich kann niemanden sehen, der versucht, eine Schlussfolgerung aus der Kausalität zu ziehen. Oder sind mexikanische Lemon-Truck-Fahrer berüchtigt gefährlich, wenn sie die Grenze überqueren?
AdamV
2
Offensichtlich eine unvorhergesehene Nebenwirkung der Fülle von Zitronengesetzen in den USA. Zum Beispiel: en.wikipedia.org/wiki/Lemon_law
Thylacoleo
11
Ein Kollege von mir hat sich die Daten dafür in der Zeit nach 2000 angesehen und festgestellt, dass die Beziehung ziemlich gut
aussortiert war
Eine einfache Erklärung wäre, dass beide mit der Zeit abnehmen. Unterstützen die Daten nach 2000 das? PS, Box Hunter und Hunter (siehe unten) erläutern das Beispiel der Störche auf die gleiche Weise: Beide nahmen im Laufe der Zeit zu.
Emil Friedman
23
  1. Manchmal reicht die Korrelation aus. In der Kfz-Versicherung sind beispielsweise männliche Fahrer häufiger mit Unfällen konfrontiert, sodass Versicherungsunternehmen höhere Gebühren erheben. Es gibt keine Möglichkeit, dies tatsächlich auf Verursachung zu testen. Sie können das Geschlecht der Fahrer nicht experimentell ändern. Google hat Hunderte von Milliarden Dollar verdient, ohne sich um die Schadensursache zu kümmern.

  2. Um eine Ursache zu finden, benötigen Sie im Allgemeinen experimentelle Daten, keine Beobachtungsdaten. Obwohl sie in der Wirtschaft häufig beobachtete "Erschütterungen" des Systems verwenden, um die Ursachen zu prüfen, z. B. wenn ein CEO plötzlich stirbt und der Aktienkurs steigt, können Sie von einer Ursache ausgehen.

  3. Korrelation ist eine notwendige, aber nicht ausreichende Bedingung für die Verursachung. Um Kausalität zu zeigen, ist Kontrafaktik erforderlich.

Neil McGuigan
quelle
1
Ich mag das erste Beispiel, das Sie geben. Das wird sicherlich die Schüler zum Reden bringen;)
csgillespie
1
Es gibt eine interessante Diskussion von Steve Steinberg auf seinem Blog hier: blog.steinberg.org/?p=11 über einige der Implikationen von 1 und wohin es in Bezug auf schwache KI führen könnte.
Amos
Könnte jemand den letzten Satz etwas erweitern?
Naught101
4
Nur eine kurze Klarstellung: Korrelation ist für die Verursachung nicht erforderlich (je nachdem, was unter Korrelation zu verstehen ist): Wenn die Korrelation eine lineare Korrelation ist (die nicht wenige statistisch versierte Personen standardmäßig annehmen, wenn der Begriff verwendet wird), sondern die Verursachung ist nichtlinear. Zum Beispiel, wenn in direkt verursacht (das Werte in annimmt ), aber . Wenn die symmetrisch verteilt sind, sind und nicht korreliert, obwohl sie perfekt abhängig sind. ( - 1 , 1 ) Y ( 0 , 1 ) Y = X(1,1)Y(0,1) X'sXYY=1X2XsXY
Glen_b
18

Ich habe ein paar Beispiele, die ich gerne verwende.

  1. Bei der Untersuchung der Kriminalitätsursache in New York in den 80er Jahren, als sie versuchten, die Stadt aufzuräumen, stellte ein Wissenschaftler eine starke Korrelation zwischen der Menge der begangenen schweren Kriminalität und der Menge der von Straßenhändlern verkauften Eiscreme fest! (Was ist die Ursache und was ist die Wirkung?) Offensichtlich gab es eine unbeobachtete Variable, die beides verursachte. Im Sommer ist die Kriminalität am größten und das meiste Eis wird verkauft.

  2. Die Größe Ihrer Handfläche hängt negativ davon ab, wie lange Sie (wirklich!) Leben werden. Tatsächlich neigen Frauen dazu, kleinere Handflächen zu haben und länger zu leben.

  3. [Mein Favorit] Ich habe vor einigen Jahren von einer Studie gehört, in der festgestellt wurde, dass die Menge an Soda, die eine Person trinkt, positiv mit der Wahrscheinlichkeit von Fettleibigkeit korreliert.(Ich sagte mir, das macht Sinn, da es daran liegen muss, dass die Leute das zuckerhaltige Soda trinken und all diese leeren Kalorien bekommen.) Ein paar Tage später kamen weitere Details heraus. Fast die gesamte Korrelation beruhte auf einem erhöhten Konsum von Diät-Erfrischungsgetränken. (Das hat meine Theorie durchgebrannt!) Also, wie ist die Ursache? Verursachen die Diät-Erfrischungsgetränke eine Gewichtszunahme oder führt eine Gewichtszunahme zu einem erhöhten Konsum von Diät-Erfrischungsgetränken? (Bevor Sie zu dem Schluss kommen, dass es sich um letzteres handelt, lesen Sie die Studie, in der kontrollierte Versuche mit Ratten zeigten, dass die Gruppe, der ein Joghurt mit künstlichem Süßstoff verabreicht wurde, an Gewicht zunahm als die Gruppe, der der normale Joghurt verabreicht wurde.) Zwei Referenzen: Drink More Diet Soda , Mehr Gewicht gewinnen? ; Diät-Limonaden im Zusammenhang mit Fettleibigkeit. Ich denke, sie versuchen immer noch, dies zu klären.

whuber
quelle
4
Das letzte ist etwas komplizierter als Sie es darstellen, aber ich stimme zu, dass ein Großteil der beobachteten Zusammenhänge zwischen Soda / Diät-Soda und Fettleibigkeit mit kritischem Auge betrachtet werden sollte. Theoretisch haben einige postuliert, dass die gefälschten Zucker- / Fettersatzstoffe andere physiologische Wirkungen haben, die über die einfache Kalorienaufnahme hinausgehen. Sehen Sie sich zum Beispiel dieses Experiment an Ratten und synthetischen Fetten an (entnommen aus dem Freakonomics-Blog).
Andy W
18

Die Anzahl der von einem Land gewonnenen Nobelpreise (bevölkerungsbereinigt) korreliert gut mit dem Pro-Kopf-Schokoladenkonsum. ( New England Journal of Medicine )

Bildbeschreibung hier eingeben

Harvey Motulsky
quelle
2
+1 Ich war sehr enttäuscht von NEJM, als sie dies veröffentlichten
MattBagg
5
Scheint auch ganz gut mit der Nähe zu Schweden zu korrelieren ..
naught101
2
Der Schokoladenkonsum (pro Kopf) korreliert ebenfalls signifikant mit der Anzahl der Serienmörder pro Kopf. replicatedtypo.com/…
Harvey Motulsky
2
Ich habe drei Nobelpreisträger gefragt, die ich (vage) kenne, und alle drei sagten, sie hätten viel mehr Schokolade gegessen als die meisten ihrer Kollegen. Diese Antworten kamen natürlich, nachdem sie die NEJM-Zeitung gelesen hatten!
Harvey Motulsky
4
@MattBagg Dies wurde als "Occasional Notes" veröffentlicht und ist offensichtlich nicht ernst zu nehmen.
Pascal
9

Es gibt zwei Aspekte dieses Post-Hoc- Problems, die ich gerne abdecken möchte: (i) umgekehrte Kausalität und (ii) Endogenität

Ein Beispiel für eine "mögliche" umgekehrte Kausalität: Soziales Trinken und Einkommen - Trinker verdienen laut Bethany L. Peters und Edward Stringham (2006) mehr Geld. "No Booze? Sie könnten verlieren: Warum Trinker mehr Geld verdienen als Nicht-Trinker", Journal of Labour Research, Transaction Publishers, Band 27 (3), Seiten 411-421, Juni). Oder trinken Menschen, die mehr Geld verdienen, mehr, weil sie ein größeres verfügbares Einkommen haben oder weil sie unter Stress stehen? Dies ist ein großartiges Papier, das aus den verschiedensten Gründen diskutiert werden kann, einschließlich Messfehler, Antwortverzerrung, Kausalität usw.

Ein Beispiel für "mögliche" Endogenität: Die Fleischwolfgleichung erklärt die Log-Einnahmen durch Bildung, Erfahrung und Erfahrung im Quadrat. Es gibt eine lange Literatur zu diesem Thema. Arbeitsökonomen möchten den kausalen Zusammenhang zwischen Bildung und Einkommen abschätzen, aber Bildung ist möglicherweise endogen, da "Fähigkeit" das Bildungsniveau eines Einzelnen erhöhen (indem die Kosten für den Erwerb gesenkt werden) und ungeachtet dessen zu einer Steigerung des Einkommens führen könnte das Bildungsniveau. Eine mögliche Lösung hierfür könnte eine instrumentelle Variable sein. Das Buch von Angrist und Pischke, Mostly Harmless Econometrics, behandelt dies und thematisiert es sehr detailliert und klar.

Andere alberne Beispiele, für die ich keine Unterstützung habe, sind: - Anzahl der Fernseher pro Kopf und die Anzahl der Sterblichkeitsraten. Senden wir also Fernsehgeräte in Entwicklungsländer. Offensichtlich sind beide endogen für so etwas wie das BIP. - Anzahl der Haiangriffe und Eisverkäufe. Beides ist für die Temperatur vielleicht endogen?

Ich erzähle auch gerne den schrecklichen Witz über die Verrückten und die Spinne. Ein Irrer läuft mit einer Spinne, die er in der Hand hält, durch die Gänge einer Irrenanstalt. Er sieht den Arzt und sagt: "Guck mal Doc, ich kann mit Spinnen reden. Pass auf." Spinne, geh nach links! "Die Spinne bewegt sich ordnungsgemäß nach links. Er fährt fort:" Spinne, geh nach rechts. "Die Spinne schlurft zu der Der Arzt antwortet: „Interessant, vielleicht sollten wir in der nächsten Gruppensitzung darüber sprechen.“ Die verrückten Erwiderungen: „Das ist nichts, Doc. Pass auf. “Er zieht nacheinander die Beine der Spinne ab und schreit dann:„ Spinne, geh nach links! “Die Spinne liegt regungslos auf seiner Handfläche und der Verrückte dreht sich zum Arzt und schließt:„ Wenn du einer Spinne die Beine abziehst Beine wird er taub werden. "

Graham Cookson
quelle
8

Das Beste, was mir beigebracht wurde, war die Anzahl der Ertrinkungen und der Verkauf von Eiscreme kann stark korrelieren, aber das bedeutet nicht, dass eines das andere verursacht. Ertrinken und Eisverkauf sind in den Sommermonaten bei gutem Wetter offensichtlich höher. Dritte Variable aka gutes Wetter verursacht sie.

TJM
quelle
6

Als Verallgemeinerung von 'Piraten verursachen globale Erwärmung': Wählen Sie zwei Größen, die (monoton) mit der Zeit zunehmen oder abnehmen, und Sie sollten eine gewisse Korrelation sehen.

Andre Holzner
quelle
6

Sie können ein paar Minuten bei Google Correlate verbringen und alle Arten von falschen Korrelationen finden.

Zach
quelle
1
Während dieser Link die Frage beantworten kann, ist es besser, die wesentlichen Teile der Antwort hier einzuschließen und den Link als Referenz bereitzustellen. Nur-Link-Antworten können ungültig werden, wenn sich die verlinkte Seite ändert.
gung
1
@gung meinst du das ernst? Der Link verweist auf eine Anwendung und nicht auf eine einfache Seite, die eine Antwort beschreibt. Die Antwort wird ungültig, wenn sich die verlinkte Seite ändert, da das Tool (in der aktuellen Form) nicht mehr verfügbar ist.
Jerome Baum
6

Ich arbeite mit Schülern im Unterrichten von Korrelation vs. Kausalität in meinen Algebra One-Klassen. Wir untersuchen viele mögliche Beispiele. Ich fand den Artikel Gebündelte Babys und gefährliches Eis: Korrelationsrätsel des Mathematiklehrers vom Februar 2013 nützlich. Ich mag die Idee, von "lauernden Variablen" zu sprechen. Auch dieser Cartoon ist ein süßer Gesprächsstarter:

Bildbeschreibung hier eingeben

Wir identifizieren die unabhängige und abhängige Variable im Cartoon und sprechen darüber, ob dies ein Beispiel für eine Kausalität ist, wenn nicht, warum nicht.

Gung
quelle
4

Ich habe (vor langer Zeit) ein interessantes Beispiel über einen Rückgang der Geburtenraten (oder Fruchtbarkeitsraten, wenn Sie diese Maßnahme bevorzugen) gelesen, insbesondere in den USA, beginnend in den frühen 1960er Jahren, als die Atomwaffentests ein Allzeithoch erreichten (1961 wurde die größte jemals gezündete Atombombe in der UdSSR getestet). Die Zinsen sanken weiter, bis die meisten Länder gegen Ende des 20. Jahrhunderts aufhörten, dies zu tun.

Ich kann keine Referenz finden, die diese Zahlen jetzt kombiniert, aber dieser Wikipedia-Artikel enthält Zahlen zu Atomwaffentests nach Ländern.

Natürlich könnte es sinnvoller sein, die Korrelation der Geburtenrate mit der Einführung und Legalisierung der Antibabypille 'zufällig' ab den frühen 1960er Jahren zu untersuchen. (In nur einigen Staaten zuerst, dann alle Staaten nur für verheiratete Frauen, dann einige für unverheiratete, dann auf ganzer Linie), aber auch das könnte nur ein Teil der Ursache sein; Viele andere Aspekte der Gleichstellung, wirtschaftliche Veränderungen und andere Faktoren spielen eine wichtige Rolle.

AdamV
quelle
Interessantes Beispiel, weil es auf den ersten Blick wie eine wahrscheinliche Ursache-Wirkungs-Beziehung aussieht, im Gegensatz zu vielen der albernsten Beispiele.
Bossykena
1
Was ich mag, ist, dass man viele Diskussionen darüber anregen kann, ob der "Effekt" tatsächlich die Fruchtbarkeit beeinflusst (im medizinischen Sinne der Empfängnisfähigkeit) oder sozial war ("Ich möchte kein Kind in dieses Böse bringen") Welt"). Lassen Sie dann die Bombe über die Pille fallen, wenn niemand anderes sie zur Sprache gebracht hat. Und dann weisen Sie darauf hin, dass auch dies nur ein möglicher Faktor sein kann, und diskutieren Sie einige der anderen.
AdamV
4

Eine Korrelation allein kann niemals einen Kausalzusammenhang herstellen. David Hume (1771-1776) argumentierte ziemlich effektiv, dass wir ein gewisses Wissen über die Kauasalität nicht mit rein empirischen Mitteln erlangen können . Kant hat versucht, das anzusprechen, die Wikipedia-Seite für Kant scheint es ganz gut zusammenzufassen:

Kant glaubte, einen Kompromiss zwischen Empirikern und Rationalisten zu finden. Die Empiriker glaubten, dass Wissen nur durch Erfahrung erlangt wird, aber die Rationalisten vertraten die Ansicht, dass dieses Wissen für kartesische Zweifel offen ist und dass uns allein der Grund Wissen liefert. Kant argumentiert jedoch, dass die Verwendung der Vernunft ohne ihre Anwendung auf die Erfahrung nur zu Illusionen führen wird, während die Erfahrung rein subjektiv sein wird, ohne zunächst unter der reinen Vernunft subsumiert zu werden.

Mit anderen Worten, Hume sagt uns, dass wir niemals wissen können, dass ein Kausalzusammenhang existiert, wenn wir nur eine Korrelation beobachten, aber Kant schlägt vor, dass wir unseren Grund verwenden können, um zwischen Korrelationen zu unterscheiden, die einen Kausalzusammenhang implizieren, und solchen, die dies nicht tun. Ich glaube nicht, dass Hume anderer Meinung gewesen wäre, solange Kant eher nach Plausibilität als nach bestimmten Kenntnissen schrieb.

Kurz gesagt, eine Korrelation liefert Indizien, die einen Kausalzusammenhang implizieren, aber das Gewicht der Indizien hängt stark von den jeweiligen Umständen ab, und wir können niemals absolut sicher sein. Die Fähigkeit, die Auswirkungen von Interventionen vorherzusagen, ist ein Weg, um Vertrauen zu gewinnen (wir können nichts beweisen, aber wir können es durch Beobachtungsbeweise widerlegen, also haben wir zumindest versucht, die Theorie eines Kausalzusammenhangs zu verfälschen). Ein einfaches Modell zu haben, das erklärt, warum wir eine Korrelation beobachten sollten, die auch andere Beweisformen erklärt, ist eine andere Möglichkeit, unsere Argumentation anzuwenden, wie Kant vorschlägt.

Vorbehalt: Es ist durchaus möglich, dass ich die Philosophie falsch verstanden habe, es bleibt jedoch der Fall, dass eine Korrelation niemals einen Beweis für einen Kausalzusammenhang liefern kann.

Dikran Beuteltier
quelle
2
Nach heutiger Terminologie sollte man Kant so lesen, als würde man z. B. in der zweiten Analogie behaupten, dass unabhängig von den beobachteten Korrelationen ein kausaler Graph sie erzeugt. Soweit mir bekannt ist, verfügte er über keine bestimmte Methode zur Identifizierung der Struktur, ging jedoch davon aus, dass diese vollständig verknüpft sein muss (weil „jedes Ereignis eine Ursache hat“). In diesem Sinne ist er zeitgemäß: Kausale Inferenz erfordert eine Mischung aus kausalen Annahmen, die z. B. über einen Graphen ausgedrückt werden, und beobachteten Regelmäßigkeiten in den Daten. Und Sie können den ersten Teil in der Regel weder vermeiden noch aus Daten induzieren
konjugieren vor dem
+1 gut erklärt! Vielleicht bin ich zu bayesianisch, aber es stört mich nicht zu sehr, dass wir keine bestimmten Kenntnisse über einen Kausalzusammenhang haben können.
Dikran Marsupial
3

Die Spermienzahl bei Männern in slowenischen Dörfern und die Anzahl der Bären (auch in Slowenien) zeigen eine negative Korrelation. Einige Leute finden das sehr beunruhigend. Ich werde versuchen, die Studie zu bekommen, die das getan hat.

Roman Luštrik
quelle
3

Ich war kürzlich auf einer Konferenz und einer der Redner gab dieses sehr interessante Beispiel (obwohl es darum ging, etwas anderes zu veranschaulichen):

  • Amerikaner und Engländer essen viel Fett. In den USA und im Vereinigten Königreich gibt es eine hohe Rate an Herz-Kreislauf-Erkrankungen.

  • Franzosen essen viel Fett, haben aber eine geringe Rate an Herz-Kreislauf-Erkrankungen.

  • Amerikaner und Engländer trinken viel Alkohol. In den USA und im Vereinigten Königreich gibt es eine hohe Rate an Herz-Kreislauf-Erkrankungen.

  • Italiener trinken viel Alkohol, haben aber auch hier eine geringe Rate an Herz-Kreislauf-Erkrankungen.

Das Fazit? Iss und trink was du willst. Und wenn Sie Englisch sprechen, haben Sie eine höhere Wahrscheinlichkeit, einen Herzinfarkt zu bekommen!

nico
quelle
3
Es ist auch ein gutes Beispiel für den ökologischen Irrtum (dh Rückschlüsse auf die individuelle Ebene aus Daten auf Gruppenebene).
Jeromy Anglim
3

Bildbeschreibung hier eingeben

Dieser Cartoon von XKCD wird auch an anderer Stelle bei CrossValidated veröffentlicht.

Harvey Motulsky
quelle
3

Ein weiteres Beispiel für die Korrelation, die ich verwendet habe, ist die große Zunahme von Menschen, die Bio-Lebensmittel essen, und die Zunahme von Kindern, bei denen in den USA Autismus diagnostiziert wird. Autismus-Bio-Lebensmittel-Parodie-Diagramm

user61177
quelle
3

http://tylervigen.com/

Dies zeigt eine Menge Korrelationen, die offensichtlich nichts mit Kausalität zu tun haben - oder haben Sie eine gute Vorstellung davon, wie die Korrelation von Age of Miss America mit Morden durch Dampf, heiße Dämpfe und heiße Gegenstände zustande kommt?

??

xyz
quelle
2

"Korrelation heißt nicht Kausalität" zu lehren, hilft niemandem wirklich, da letztendlich alle deduktiven Argumente teilweise auf Korrelation beruhen.

Menschen sind sehr schlecht darin zu lernen, etwas nicht zu tun.

Das Ziel sollte eher konstruktiv sein: Denken Sie immer an Alternativen zu Ihren Ausgangsannahmen, die dieselben Daten liefern könnten.

Christian
quelle
1
Dies beantwortet die Frage nicht: Vielleicht sollte es als Kommentar verstanden werden.
whuber
2

Nun, mein Prof. hat diese in der Einführungswahrscheinlichkeitsklasse verwendet:

1) Die Schuhgröße hängt mit der Lesefähigkeit zusammen

2) Der Haiangriff ist mit dem Verkauf von Speiseeis verbunden.

Shrey
quelle
2

Je mehr Feuerwehrautos ins Feuer geschickt werden, desto größer ist der Schaden.

xmjx
quelle
1
Das einzige Problem bei diesem Beispiel ist, dass es eine eindeutige umgekehrte Kausalität gibt.
naught101
1

Ich denke, ein besseres Paradigma könnte sein, dass Kausalität eine Korrelation erfordert, die mit einem glaubwürdigen und vorzugsweise nachgewiesenen Mechanismus verbunden ist. Ich denke, das Wort implizieren sollte in diesem Zusammenhang sehr sparsam verwendet werden, da es mehrere Bedeutungen hat, einschließlich der des Vorschlags.

Robert Jones
quelle
1

Das Störche-Beispiel befindet sich auf Seite 8 der ersten Ausgabe (1978) von Box, Hunter & Hunter's Buch mit dem Titel "Statistics for Experimenters ..." (Wiley). Ich weiß nicht, ob es in der 2. Auflage ist. Sie identifizieren die Stadt als Oldenburg und den Zeitraum 1930-1936.

Sie beziehen sich auf Ornithologische Monatsberichte , 44 , Nr. 2, Jahrgang, 1936, Berlin und 48 , Nr. 1, Jahrgang, 1940, Berlin und Statistiches Jahrbuch Deutscher Gemeinden , 27-33, 1932-1938, Gustav Fischer, Jena.

Emil Friedman
quelle
0

Ich habe in einem Artikel einen lustigen gesehen.

Die Butterproduktion in Bangladesch weist eine der höchsten Korrelationen mit dem S & P 500 über einen Zeitraum von zehn Jahren auf.

http://www.forbes.com/sites/davidleinweber/2012/07/24/stupid-data-miner-tricks-quants-fooling-the-economic-indicator-in-your-pants/

Diese
quelle
2
Huh? Die Grafik zeigt den S & P über die Zeit. Der Titel handelt von der Herstellung von Butter und Käse, die in der Grafik nicht sichtbar sind. ???
Harvey Motulsky
3
OK, jetzt verstehe ich. Das Diagramm zeigt die Vorhersage eines multiplen Regressionsmodells. Es zeigt, dass das Einbeziehen von drei albernen Variablen eine ziemlich gute Arbeit leistet, um das Modell dazu zu bringen, Änderungen im SP500 im Zeitverlauf vorherzusagen. Dies ist ein gutes Beispiel für eine Überanpassung bei multipler Regression und zeigt indirekt, dass die Korrelation (oder die verbesserte Anpassungsgüte eines ausgefallenen Modells) keine Kausalität impliziert.
Harvey Motulsky
0

Hier ist eine perfekte. Und leider kann es als großartiger Lehrpunkt verwendet werden, da weder die Mitarbeiter der Washington Post noch die Zentren für Krankheitskontrolle und Prävention den Verdacht haben, dass der Artikel in The Onion ein Satire-Stück sein sollte.

https://www.washingtonpost.com/health/trumps-presidency-may-be-making-latinos-sick/2019/07/19/4e89b9f0-a97f-11e9-9214-246e594de5d5_story.html?utm_term=.9dd329c2e837

Mark C.
quelle
3
Fassen Sie bitte zusammen, was hinter dem Link steht und nicht nur, dass Sie ihn für falsch halten.
Glaube
Es tut uns leid. Aber ich fand, dass dies selbsterklärend ist.
Mark C.
2
Der Link ist als Verweis auf die Quelle in Ordnung, aber Sie sollten nicht davon ausgehen, dass jeder ihn tatsächlich lesen kann (oder nicht ohne großen Aufwand). Bitte beachten Sie: Solche Links unterliegen stark der Linkfäule, und nicht alle Zeitungen bedienen alle geografischen Regionen (z. B. gibt es US-Zeitungen, die entschieden haben, dass die Einhaltung der EU-DSGVO keine Mühe wert ist, und die folglich Leser mit EU-Schutzrechten blockieren Adresse).
Glaube
-2

Jemand sagte, Korrelation bedeutet vielleicht nicht Verursachung, aber es kann sicherlich ein guter Hinweis sein :)

Ok, abgesehen von dem lustigen Teil, was genau ist Kausalität? Sind wir wirklich sicher, dass Piraten keine globale Erwärmung verursachen?

Kontraintuitiv, aber was als Ursache und was als Wirkung aufgefasst wird (in einer Korrelationsstudie ist das nicht so klar). Natürlich können viele Male beide nur Auswirkungen einer gemeinsamen Ursache sein (und damit korrelieren)

Es läuft alles auf die Methode zur Bestimmung der Kausalität hinaus.

Dies ist die Ursache (Wortspiel beabsichtigt) des Sprichworts:

Es gibt kleine Lügen. Es gibt große Lügen und es gibt Statistiken.

Nikos M.
quelle