Korrelation impliziert keine Kausalität, da es viele Erklärungen für die Korrelation geben könnte. Aber impliziert Kausalität Korrelation? Intuitiv würde ich denken, dass das Vorhandensein von Kausalität zwangsläufig eine gewisse Korrelation bedeutet. Aber meine Intuition hat mir in der Statistik nicht immer gute Dienste geleistet. Bedeutet Kausalität Korrelation?
correlation
causality
Matthew
quelle
quelle
Antworten:
Wie viele der obigen Antworten bereits ausgeführt haben, impliziert die Kausalität keine lineare Korrelation . Da viele Korrelationskonzepte aus Feldern stammen, die stark von linearen Statistiken abhängen, wird Korrelation normalerweise als gleich lineare Korrelation angesehen. Der Wikipedia-Artikel ist eine gute Quelle dafür, ich mag dieses Bild wirklich:
Schauen Sie sich einige der Figuren in der unteren Reihe an, zum Beispiel die parabelförmige Form im vierten Beispiel. Dies geschieht in @StasK answer (mit ein wenig Rauschen). Y kann vollständig durch X verursacht werden, aber wenn die numerische Beziehung nicht linear und symmetrisch ist, haben Sie immer noch eine Korrelation von 0.
Das Wort, nach dem Sie suchen, ist gegenseitige Information : Dies ist eine Art allgemeine nichtlineare Version der Korrelation. In diesem Fall wäre Ihre Aussage wahr: Kausalität impliziert eine hohe gegenseitige Information .
quelle
Die strenge Antwort lautet "Nein, Kausalität impliziert nicht unbedingt Korrelation".
Betrachte und . Verursachung bekommt keine stärker: bestimmt . Die Korrelation zwischen und ist jedoch 0. Beweis: Die (gemeinsamen) Momente dieser Variablen sind: ; ; Verwendung von die Eigenschaft der Standardnormalverteilung, dass ihre ungeraden Momente alle gleich Null sind (kann leicht aus ihrer momenterzeugenden Funktion abgeleitet werden). Daher ist die Korrelation gleich Null.X∼N(0,1) Y=X2∼χ21 X Y X Y E[X]=0 E[Y]=E[X2]=1
Um auf einige der Kommentare einzugehen: Der einzige Grund, warum dieses Argument funktioniert, ist, dass die Verteilung von auf Null zentriert und um 0 symmetrisch ist. Tatsächlich hätte jede andere Verteilung mit diesen Eigenschaften, die eine ausreichende Anzahl von Momenten hätte, funktioniert Stelle von , zB Uniform auf oder Laplace . Ein stark vereinfachtes Argument ist, dass für jeden positiven Wert von ein ebenso wahrscheinlicher negativer Wert von gleicher Größe vorliegt. Wenn Sie also das quadrieren, können Sie nicht sagen, dass größere Werte von mit größeren oder kleineren Werten verknüpft sind vonX N(0,1) (−10,10) ∼exp(−|x|) X X X X Y . Wenn Sie jedoch , dann ist , , und . Dies macht durchaus Sinn: Für jeden Wert von unter Null gibt es einen weitaus wahrscheinlicheren Wert von der über Null liegt, sodass größere Werte von größeren Werten von . (Letzteres hat eine nicht-zentrale Verteilung ; Sie können die Varianz von der Wikipedia-Seite abrufen und die Korrelation berechnen, wenn Sie interessiert sind.)X∼N(3,1) E[X]=3 E[Y]=E[X2]=10 E[X3]=36 Cov[X,Y]=E[XY]−E[X]E[Y]=36−30=6≠0 X −X X Y χ2
quelle
Im Wesentlichen ja.
Korrelation impliziert keine Kausalität, da es andere Erklärungen für eine Korrelation geben könnte, die über die Ursache hinausgeht. Aber damit A eine Ursache für B ist , müssen sie in irgendeiner Weise verbunden sein . Das heißt, es besteht eine Korrelation zwischen ihnen - obwohl diese Korrelation nicht unbedingt linear sein muss.
Wie einige der Kommentatoren vorgeschlagen haben, ist es wahrscheinlich sinnvoller, einen Begriff wie "Abhängigkeit" oder "Assoziation" zu verwenden, als eine Korrelation. Obwohl ich in den Kommentaren erwähnt habe, habe ich gesehen, dass "Korrelation nicht Kausalität" als Reaktion auf eine Analyse ist, die weit über die einfache lineare Korrelation hinausgeht, und daher habe ich für die Zwecke des Sprichworts die "Korrelation" im Wesentlichen auf jede erweitert Assoziation zwischen A und B.
quelle
Hinzufügen zu @EpiGrads Antwort. Ich denke, für viele Leute wird "Korrelation" "lineare Korrelation" bedeuten. Und das Konzept der nichtlinearen Korrelation ist möglicherweise nicht intuitiv.
Also würde ich sagen "nein, sie müssen nicht korreliert sein, aber sie müssen verwandt sein ". Wir sind uns einig in der Sache, sind uns aber nicht einig, wie wir die Sache am besten vermitteln können.
Ein Beispiel für eine solche Ursache (zumindest die Leute denken, dass sie ursächlich ist) ist die Wahrscheinlichkeit, dass Sie das Telefon beantworten, und das Einkommen. Es ist bekannt, dass Menschen an beiden Enden des Einkommensspektrums ihre Telefone mit geringerer Wahrscheinlichkeit beantworten als Menschen in der Mitte. Es wird angenommen, dass das Kausalmuster für Arme (z. B. Vermeiden von Geldsammlern) und Reiche (z. B. Vermeiden von Personen, die um Spenden bitten) unterschiedlich ist.
quelle
Die Dinge sind hier definitiv nuanciert. Verursachung nicht Korrelation impliziert nicht einmal statistische Abhängigkeit, zumindest nicht in der einfachen Art , wie wir über sie in der Regel denken, oder in der Art und Weise einige Antworten sind darauf hindeutet , (nur transformieren oder usw.).X Y
Betrachten Sie das folgende Kausalmodell:
Das heißt, sowohl und Ursache .X U Y
Nun lass:
Angenommen, Sie beobachten . Beachten Sie, dass . Das heißt, obwohl verursacht (im Sinne einer nichtparametrischen Strukturgleichung), sehen Sie keine Abhängigkeit! Sie können jede gewünschte nichtlineare Transformation durchführen, und dies wird keine Abhängigkeit erkennen lassen, da hier keine marginale Abhängigkeit von und .U P(Y|X)=P(Y) X Y Y X
Der Trick ist, dass, obwohl und verursachen , ihr durchschnittlicher Kausaleffekt geringfügig Null ist. Sie sehen nur die (exakte) Abhängigkeit, wenn Sie sowohl auf als auch auf zusammen konditionieren (das zeigt auch, dass und nicht implizieren ). Also, ja, man könnte argumentieren, dass, obwohl verursacht , der marginale kausale Effekt von auf Null ist, weshalb wir keine Abhängigkeit von und . Dies zeigt jedoch nur, wie differenziert das Problem ist, daU Y X U X ⊥ Y U ⊥ Y { X , U } ⊥ Y X Y X Y X Y X Y UX U Y X U X⊥Y U⊥Y {X,U}⊥Y X Y X Y X Y X verursacht , nicht nur so, wie Sie es naiv denken würden (es interagiert mit ).Y U
Kurz gesagt würde ich sagen, dass: (i) Kausalität Abhängigkeit suggeriert ; aber (ii) die Abhängigkeit ist eine funktionale / strukturelle Abhängigkeit und kann sich in der spezifischen statistischen Abhängigkeit, an die Sie denken, niederschlagen oder nicht.
quelle
Die Ursache und die Wirkung wird in Beziehung gesetzt werden , es sei denn es keine Variation ist bei allen in der Häufigkeit und der Größe der Ursache und ohne Veränderung überhaupt in ihrer kausalen Kraft. Die einzige andere Möglichkeit wäre, wenn die Ursache perfekt mit einer anderen kausalen Variablen korreliert ist, mit genau dem gegenteiligen Effekt. Grundsätzlich sind dies gedankliche Versuchsbedingungen. In der realen Welt impliziert die Kausalität in irgendeiner Form eine Abhängigkeit (obwohl es sich möglicherweise nicht um eine lineare Korrelation handelt).
quelle
Hier gibt es gute Antworten. Artem Kaznatcheev , Fomite und Peter Flom weisen darauf hin, dass Kausalität normalerweise eher Abhängigkeit als lineare Korrelation impliziert. Carlos Cinelli gibt ein Beispiel, in dem es keine Abhängigkeit gibt, weil die Erzeugungsfunktion so eingerichtet ist.
Ich möchte einen Punkt hinzufügen, wie diese Abhängigkeit in der Praxis verschwinden kann, und zwar in den Arten von Datensätzen, mit denen Sie möglicherweise arbeiten. Situationen wie Carlos 'Beispiel beschränken sich nicht auf bloße "Gedankenexperimentbedingungen".
Abhängigkeiten verschwinden in sich selbst regulierenden Prozessen . Die Homöostase sorgt beispielsweise dafür, dass Ihre innere Körpertemperatur unabhängig von der Raumtemperatur bleibt. Externe Wärme beeinflusst direkt Ihre Körpertemperatur, beeinflusst aber auch die Kühlsysteme des Körpers (z. B. Schwitzen), die die Körpertemperatur stabil halten. Wenn wir die Temperatur in extrem schnellen Intervallen und mit extrem präzisen Messungen messen, haben wir die Möglichkeit, die kausalen Abhängigkeiten zu beobachten, aber bei normalen Abtastraten scheinen Körpertemperatur und Außentemperatur unabhängig voneinander zu sein.
Selbstregulierende Prozesse sind in biologischen Systemen weit verbreitet. Sie werden durch Evolution erzeugt. Säugetiere, die ihre Körpertemperatur nicht regulieren können, werden durch natürliche Auslese entfernt. Forscher, die mit biologischen Daten arbeiten, sollten sich bewusst sein, dass kausale Abhängigkeiten in ihren Datensätzen verschwinden können.
quelle
Wäre eine Ursache ohne Korrelation nicht eine Sache?
Wenn Sie nicht, wie die akzeptierte Antwort andeutet, eine unglaublich eingeschränkte Interpretation des Wortes "Korrelation" verwenden, ist dies eine dumme Frage Bevölkerungswachstum oder nur Intensität.
richtig?
Andererseits könnten Sie über etwas mehr diskutieren, die Sichtbarkeit von etwas, das von etwas anderem beeinflusst wird, was meiner Meinung nach wie eine Kausalität aussieht, aber Sie messen wirklich nicht, was Sie denken, dass Sie messen ...
Also ja, ich denke die kurze Antwort wäre: "Ja, solange du keine Entropie erschaffen kannst."
quelle