Zunächst frage ich nicht:
Warum bedeutet Nullkorrelation keine Unabhängigkeit?
Dies wird hier (ziemlich gut) angesprochen : /math/444408/why-does-zero-correlation-not-imply-independence
Was ich frage ist das Gegenteil ... sagen zwei Variablen sind völlig unabhängig voneinander.
Könnten sie nicht zufällig ein kleines bisschen Korrelation haben?
Sollte es nicht sein ... Unabhängigkeit impliziert SEHR KLEINE Korrelation?
correlation
mathematical-statistics
covariance
independence
Joshua Ronis
quelle
quelle
Antworten:
Durch die Definition des Korrelationskoeffizienten ist ihre Korrelation Null, wenn zwei Variablen unabhängig sind. Zufällig konnte es also zu keiner Korrelation kommen!
Wenn und unabhängig sind, bedeutet . Daher ist der Zähler von in diesem Fall Null.X Y E[XY]=E[X]E[Y] ρX,Y
Wenn Sie also die hier erwähnte Bedeutung der Korrelation nicht ändern, ist dies nicht möglich. Wenn nicht, klären Sie Ihre Definition anhand der Korrelation.
quelle
Kommentar zur Probenkorrelation . Bei einem Vergleich der zwei kleine unabhängige Proben der gleichen Größe, die Probe Korrelation oft deutlich von [Nichts ist hier im Widerspruch @ OmG Antwort- (+1) auf der Bevölkerung Korrelationr=0. ρ . ]ρ.]
Betrachten Sie Korrelationen zwischen einer Million Paare unabhängiger Stichproben der Größe aus der Exponentialverteilung mit Raten=5 1.
Hier ist zum Beispiel das Streudiagramm des ersten der Millionen Paare von Proben der Größe für die5, r=−0.5716.
In dieser Hinsicht ist die Exponentialverteilung nichts Besonderes. Das Ändern der Elternverteilung auf Standardnormal ergab die folgenden Ergebnisse.
Im Gegensatz dazu ist hier das entsprechende Histogramm der Korrelationen für Paare normaler Stichproben der Größen=20.
Hinweis: Auf anderen Seiten dieser Site wird die Verteilung von genauer erläutert. einer von ihnen ist die Q & A .r
quelle
Einfache Antwort: Wenn zwei Variablen unabhängig sind, ist die Populationskorrelation Null, wohingegen die Stichprobenkorrelation normalerweise klein ist, aber nicht Null.
Das liegt daran, dass die Stichprobe keine perfekte Darstellung der Bevölkerung ist.
Je größer die Stichprobe ist, desto besser repräsentiert sie die Population. Je geringer die Korrelation, die Sie haben. Für eine unendliche Stichprobe wäre die Korrelation Null.
quelle
Vielleicht ist dies hilfreich für einige Leute, die das gleiche intuitive Verständnis teilen. Wir haben alle so etwas gesehen:
Diese Daten sind vermutlich unabhängig, weisen jedoch eine eindeutige Korrelation auf ( ). "Ich dachte, Unabhängigkeit impliziert keine Korrelation!" der Student sagt.r=0.66
Wie bereits erwähnt, sind die Stichprobenwerte korreliert, was jedoch nicht bedeutet, dass die Grundgesamtheit eine Korrelation ungleich Null aufweist.
Natürlich sollten diese beiden unabhängig sein - da Nicolas Cage in diesem Jahr in zehn Filmen mit Rekordauflage auftrat, sollten wir aus Sicherheitsgründen den örtlichen Pool für den Sommer nicht schließen.
Wenn wir jedoch nachsehen, wie viele Menschen in diesem Jahr ertrinken, ist die Wahrscheinlichkeit gering, dass in diesem Jahr 1000 Menschen in Rekordhöhe ertrinken.
Eine solche Korrelation ist unwahrscheinlich. Vielleicht einer von tausend. Aber es ist möglich, obwohl die beiden unabhängig sind. Dies ist jedoch nur ein Fall. Bedenken Sie, dass dort Millionen von möglichen Ereignissen zu messen sind und dass die Wahrscheinlichkeit, dass zwei Ereignisse eine hohe Korrelation ergeben, ziemlich hoch ist (daher gibt es Grafiken wie die oben genannten).
Eine andere Sichtweise ist, dass die Gewährleistung, dass zwei unabhängige Ereignisse immer unkorrelierte Werte ergeben, selbst einschränkend ist. Bei zwei unabhängigen Würfeln und den Ergebnissen des ersten gibt es für den zweiten Würfel eine bestimmte (beträchtliche) Menge von Ergebnissen, die eine Korrelation ungleich Null ergeben. Das Beschränken der Ergebnisse des zweiten Würfels auf eine Korrelation von Null mit dem ersten Würfel ist eine eindeutige Verletzung der Unabhängigkeit, da die Würfelwürfe des ersten Würfels nun die Verteilung der Ergebnisse beeinflussen.
quelle