Kann jemand veranschaulichen, wie es Abhängigkeit und Null-Kovarianz geben kann?

12

Kann jemand wie Greg veranschaulichen, aber detaillierter, wie Zufallsvariablen abhängig sein können, aber keine Kovarianz haben? Greg, ein Poster hier, gibt ein Beispiel einen Kreis mit hier .

Kann jemand diesen Prozess anhand einer Abfolge von Schritten näher erläutern, die den Prozess in mehreren Phasen veranschaulichen?

Wenn Sie ein Beispiel aus der Psychologie kennen, veranschaulichen Sie es bitte mit diesem Konzept anhand eines verwandten Beispiels. Bitte seien Sie in Ihrer Erklärung sehr präzise und sequentiell und geben Sie auch an, welche Konsequenzen dies haben könnte.

user11883
quelle
Ein Link zu dem Artikel, auf den Sie verweisen, würde helfen.
gui11aume
1
Ich bin mir ziemlich sicher, dass das Thema hier ist: stats.stackexchange.com/questions/12842/… und die Antwort von Greg (Snow) ist hier: stats.stackexchange.com/a/12898/2073
Andy McKenzie
Ich dachte anfangs, das Schließen dieser Frage sei richtig, aber ich denke, es stellt vielleicht eine etwas andere Frage als hier stats.stackexchange.com/questions/12842/…, da dieser Thread nur nach mathematischen Beispielen gefragt hat, während diese Frage nach einem genauen Verständnis zu suchen scheint warum die beiden nicht gleichwertig sind
Makro

Antworten:

21

Die Grundidee dabei ist, dass die Kovarianz nur eine bestimmte Art von Abhängigkeit misst , daher sind die beiden nicht gleichwertig. Speziell,

  • Die Kovarianz ist ein Maß dafür, wie linear zwei Variablen miteinander verbunden sind. Wenn zwei Variablen nicht linear miteinander verbunden sind, wird dies nicht in der Kovarianz berücksichtigt. Eine ausführlichere Beschreibung finden Sie hier .

  • Die Abhängigkeit zwischen Zufallsvariablen bezieht sich auf jede Art von Beziehung zwischen den beiden, die dazu führt, dass sie "zusammen" anders handeln als "allein". Insbesondere setzt die Abhängigkeit zwischen Zufallsvariablen jede Beziehung zwischen den beiden voraus, die dazu führt, dass ihre gemeinsame Verteilung nicht das Produkt ihrer Randverteilungen ist. Dies schließt lineare Beziehungen sowie viele andere ein.

  • Wenn zwei Variablen nicht linear miteinander verbunden sind, können sie möglicherweise eine Kovarianz von 0 aufweisen, sind jedoch immer noch abhängig. Hier werden viele Beispiele angegeben , und in der folgenden Darstellung aus Wikipedia sind einige grafische Beispiele in der unteren Zeile aufgeführt:

    Geben Sie hier die Bildbeschreibung ein

  • Ein Beispiel, bei dem Kovarianz Null und Unabhängigkeit zwischen Zufallsvariablen äquivalente Bedingungen sind, ist, wenn die Variablen gemeinsam normalverteilt sind ( dh die beiden Variablen folgen einer bivariaten Normalverteilung , die nicht äquivalent zu den beiden Variablen ist, die einzeln normalverteilt sind). Ein weiterer Sonderfall ist, dass Paare von Bernoulli-Variablen genau dann nicht korreliert sind, wenn sie unabhängig sind (danke @cardinal). Im Allgemeinen können die beiden jedoch nicht als gleichwertig angesehen werden.

Daher kann man im Allgemeinen nicht schließen, dass zwei Variablen unabhängig sind, nur weil sie unkorreliert erscheinen (z. B. die Nullhypothese ohne Korrelation nicht zurückgewiesen hat). Man ist gut beraten, Daten zu zeichnen, um zu schließen, ob die beiden verwandt sind, und nicht nur bei einem Korrelationstest anzuhalten. Wenn Sie beispielsweise (danke @gung) eine lineare Regression durchführen (dh auf Nicht-Null-Korrelation testen) und ein nicht signifikantes Ergebnis finden, könnten Sie versucht sein, zu dem Schluss zu kommen, dass die Variablen nicht miteinander zusammenhängen, aber Sie ' Ich habe nur eine lineare Beziehung untersucht.

Ich weiß nicht viel über Psychologie, aber es ist sinnvoll, dass es dort nichtlineare Beziehungen zwischen Variablen geben kann. Als Spielzeugbeispiel scheint es möglich, dass die kognitiven Fähigkeiten nicht linear mit dem Alter zusammenhängen - sehr junge und sehr alte Menschen sind nicht so scharf wie 30 Jahre alt. Wenn man ein Maß für die kognitive Fähigkeit im Verhältnis zum Alter aufzeichnet, kann man erwarten, dass die kognitiven Fähigkeiten in einem moderaten Alter am höchsten sind und um diese herum abnehmen, was ein nichtlineares Muster wäre.

Makro
quelle
1
Nur eine Randnotiz ( pedantisch?! ), Aber Bernoulli-Zufallsvariablen sind genau dann unabhängig, wenn sie nicht korreliert sind. :)
Kardinal
@cardinal, mach dir keine Sorgen, dass ich nur die Rationalität wieder aufgeben muss, so wie du gesagt hast, dass eine multivariate Normalen mit einer singulären Kovarianzmatrix "häufig verwendet und statistisch relevant" sind.
Makro
Wenn ich das nächste Mal in Ann Arbor bin, kaufe ich dir einen Kaffee, um diesen Witz auszugleichen. :) Fühlen Sie sich frei, meine Rationalität in der Zwischenzeit in Frage zu stellen. :)
Kardinal
Ah, aber dieses letzte Zitat ist wahr . ;-) Es zeigt sich an einigen überraschend häufigen Orten. :) (Obwohl das hier ein wenig vom Thema
Kardinal
(+1) Ich war irgendwie am Zaun darüber, ob diese Frage als Duplikat geschlossen werden sollte oder nicht. Aber ich denke, gute Antworten können sehr ähnliche Fragen wert sein, behalten zu werden. Alles vernetzt zu haben hilft.
Kardinal
7

Eine Standardmethode zum Lehren / Visualisieren einer Korrelation oder Kovarianz besteht darin, die Daten zu zeichnen, Linien im Mittel von 'x' und 'y' zu zeichnen und dann Rechtecke vom Punkt der 2 Mittelwerte zu den einzelnen Datenpunkten zu zeichnen, wie folgt:

Geben Sie hier die Bildbeschreibung ein

Die Rechtecke (Punkte) im oberen rechten und unteren linken Quadranten (im Beispiel rot) tragen positive Werte zur Korrelation / Kovarianz bei, während die Rechtecke (Punkte) im oberen linken und unteren rechten Quadranten (im Beispiel blau) einen negativen Beitrag leisten Werte zur Korrelation / Kovarianz. Wenn die Gesamtfläche der roten Rechtecke der Gesamtfläche der blauen Rechtecke entspricht, heben sich die positiven und negativen Werte auf und Sie erhalten eine Kovarianz von Null. Wenn mehr Fläche im roten Bereich vorhanden ist, ist die Kovarianz positiv, und wenn mehr Fläche im blauen Bereich vorhanden ist, ist die Kovarianz negativ.

Schauen wir uns nun ein Beispiel aus der vorherigen Diskussion an:

Geben Sie hier die Bildbeschreibung ein

Die einzelnen Punkte folgen einer Parabel, daher sind sie abhängig. Wenn Sie 'x' kennen, kennen Sie 'y' genau, aber Sie können auch sehen, dass für jedes rote Rechteck ein passendes blaues Rechteck vorhanden ist, sodass die endgültige Kovarianz 0 ist .

Greg Snow
quelle
(+1) RGibt es ein Paket, das diese Diagramme erstellt (ich erinnere mich, dass ich ein Diagramm wie dieses einmal angezeigt habe), oder haben Sie dies von Grund auf neu gemacht?
Makro
@ Macro, gute Frage, obwohl ich denke, dass Whuber's in Mathematica gemacht wurden. Es ist einfach, dies "von Hand" in R mit polygonoder rectund einem Gerät zu tun , das Alpha-Transparenz unterstützt.
Kardinal
Ich habe eine Funktion für diesen Plot geschrieben und werde sie wahrscheinlich TeachingDemosbald zum Paket hinzufügen . Mein erster Gedanke war, den Ausdruck "Korrelationsrechtecke" auf "korrekt" als Namen der Funktion zu kürzen und dann nach einiger Zeit zu erkennen, dass der Name leicht als etwas ganz anderes missverstanden werden kann. Also muss ich mir einen besseren Namen einfallen lassen, ein paar Optionen hinzufügen und ihn auf R-Forge hochladen.
Greg Snow
3

Ein einfacher Test, wenn die Daten im Wesentlichen einem Muster folgen, das durch die Mittel um eine vertikale oder horizontale Achse symmetrisch ist, ist die Kovarianz ziemlich nahe bei Null. Wenn die Symmetrie beispielsweise um die y-Achse liegt, bedeutet dies, dass für jeden Wert mit einem gegebenen y eine positive x-Differenz zum Mittelwert x und eine negative Differenz zum Mittelwert x besteht. Die Addition von y * x für diese Werte ist Null. Sie können dies gut in der Sammlung von Beispielplots in den anderen Antworten sehen. Es gibt andere Muster, die eine Ko-Varianz von Null ergeben würden, aber keine Unabhängigkeit, aber viele Beispiele können leicht bewertet werden, indem nach Symmetrie gesucht wird oder nicht.

David B.
quelle
1

Ein Beispiel aus Wikipedia :

"Wenn die Variablen unabhängig sind, ist der Pearson-Korrelationskoeffizient 0, aber das Gegenteil ist nicht der Fall, da der Korrelationskoeffizient nur lineare Abhängigkeiten zwischen zwei Variablen erkennt. Angenommen, die Zufallsvariable X ist symmetrisch um Null verteilt und Y = X ^ 2. Dann wird Y vollständig durch X bestimmt, so dass X und Y perfekt abhängig sind, aber ihre Korrelation Null ist; sie sind nicht korreliert. In dem speziellen Fall, in dem X und Y gemeinsam normal sind, ist Unkorreliertheit jedoch gleichbedeutend mit Unabhängigkeit. "

accssharma
quelle