Ich weiß empirisch, dass dies der Fall ist. Ich habe gerade Modelle entwickelt, die auf dieses Rätsel stoßen. Ich vermute auch, dass es nicht unbedingt eine Ja / Nein-Antwort ist. Ich meine damit, dass, wenn sowohl A als auch B mit C korreliert sind, dies eine gewisse Auswirkung auf die Korrelation zwischen A und B haben kann. Diese Auswirkung kann jedoch schwach sein. Es kann nur eine Zeichenrichtung sein und sonst nichts.
Hier ist, was ich meine ... Nehmen wir an, A und B haben beide eine 0,5-Korrelation mit C. Angesichts dessen könnte die Korrelation zwischen A und B durchaus 1,0 sein. Ich denke, es könnte auch 0,5 oder noch niedriger sein. Aber ich denke, es ist unwahrscheinlich, dass es negativ sein würde. Sind Sie einverstanden (damit?
Gibt es auch eine Auswirkung, wenn Sie den Standard-Pearson-Korrelationskoeffizienten oder stattdessen den Spearman-Korrelationskoeffizienten (Rang) in Betracht ziehen? Meine jüngsten empirischen Beobachtungen wurden mit dem Spearman-Korrelationskoeffizienten in Verbindung gebracht.
Antworten:
Da Korrelation eine mathematische Eigenschaft multivariater Verteilungen ist, kann eine gewisse Einsicht nur durch Berechnungen gewonnen werden, unabhängig von der statistischen Genese dieser Verteilungen.
Für die Pearson - Korrelationen , betrachten multinormal Variablen , Y , Z . Es ist nützlich, mit diesen zu arbeiten, da jede nicht negative definite Matrix tatsächlich die Kovarianzmatrix einiger multinormaler Verteilungen ist, wodurch die Existenzfrage gelöst wird. Wenn wir uns an Matrizen mit 1 auf der Diagonale halten, sind die nicht diagonalen Einträge der Kovarianzmatrix ihre Korrelationen. Schreiben der Korrelation von X und Y als ρ , der Korrelation von Y und Z als τ und der Korrelation von X und Z alsX Y Z 1 X Y ρ Y Z τ X Z , das berechnen wirσ
(weil dies die Determinante der Korrelationsmatrix ist und sie nicht negativ sein kann).1+2ρστ−(ρ2+σ2+τ2)≥0
Wenn dies, dass ρ 2 + τ 2 ≤ 1 ist . Um es anders auszudrücken: wenn beide ρ und τ in der Größe groß sind, X und Z muss ungleich Null Korrelation aufweisen.σ=0 ρ2+τ2≤1 ρ τ X Z
Wenn , dann ist jede nicht-negativer Wert von σ (zwischen 0 und 1 natürlich) ist möglich.ρ2=τ2=1/2 σ 0 1
Wenn , sind negative Werte von σ zulässig. Zum Beispiel, wenn ρ = τ = 1 / 2 , σ kann irgendwo zwischen sein - 1 / 2 und 1 .ρ2+τ2<1 σ ρ=τ=1/2 σ −1/2 1
Diese Überlegungen implizieren, dass die gegenseitigen Korrelationen tatsächlich einige Einschränkungen aufweisen. Die Beschränkungen (die nur von der nicht negativen Bestimmtheit der Korrelationsmatrix, nicht von den tatsächlichen Verteilungen der Variablen abhängen) können in Abhängigkeit von Annahmen über die univariaten Verteilungen verschärft werden. Zum Beispiel ist es leicht zu erkennen (und zu beweisen), dass die Korrelationen , wenn die Verteilungen von und Y nicht zur selben Familie der Ortsskalen gehören, streng kleiner als 1 sein müssen . (Beweis: Eine Korrelation von ± 1 impliziert, dass X und Y linear zusammenhängen als)X Y 1 ±1 X Y
So weit wie Spearman Rank Korrelationen gehen, betrachtet drei trivariaten Beobachtungen , ( 2 , 3 , 1 ) und ( 3 , 2 , 3 ) von ( X , Y , Z ) . Ihre gegenseitige Rangkorrelationen sind 1 / 2 , 1 / 2 , und - 1 / 2 . Damit auch das Vorzeichen der Rangkorrelation von(1,1,2) (2,3,1) (3,2,3) (X,Y,Z) 1/2 1/2 −1/2 und Z können die Umkehrung der Vorzeichen der Korrelationen von X und Y und X und Z sein .Y Z X Y X Z
quelle
Ich bin gerade auf einer jährlichen Angeltour. Es gibt eine Korrelation zwischen der Tageszeit, die ich fische, und der Menge an Fischen, die ich fange. Es gibt auch eine Korrelation zwischen der Größe des Köders und der Menge der Fische, die ich fange. Es gibt keine Korrelation zwischen der Größe des Köders und der Tageszeit.
quelle
quelle
Als Ergänzung zu Whubers Antwort: Die vorgestellte Formel
kann in folgende Ungleichung umgewandelt werden (Olkin, 1981):
Olkin, I. (1981). Bereichsbeschränkungen für Produkt-Moment-Korrelationsmatrizen. Psychometrika, 46, 469 & ndash; 472. doi: 10.1007 / BF02293804
quelle
Ich denke, es ist besser zu fragen, "warum sollten sie korreliert werden?" oder vielleicht "Warum sollte eine bestimmte Korrelation bestehen?"
Der folgende R-Code zeigt einen Fall, in dem x1 und x2 beide mit Y korreliert sind, aber eine Korrelation von 0 miteinander haben
Die Korrelation mit Y kann verstärkt werden, indem .3 auf .1 oder was auch immer reduziert wird
quelle
Ich überlasse die statistische Demonstration denen, die dafür besser geeignet sind als ich ... aber sage intuitiv, dass Ereignis A einen Prozess X erzeugt, der zur Erzeugung von Ereignis C beiträgt. Dann wird A mit C (durch X) korreliert. B erzeugt andererseits Y, das auch C formt. Daher ist A mit C korreliert, B ist mit C korreliert, aber A und B sind nicht korreliert.
quelle
Für diejenigen, die eine gewisse Intuition wünschen, kann eine Korrelation als ein Kosinus mit einem gewissen Winkel angesehen werden. Betrachten Sie also drei Vektoren in 3D, beispielsweise A, B und C, die jeweils einer Variablen entsprechen. Die Frage ist, den Bereich möglicher Winkel zwischen A und C zu bestimmen, wenn der Winkel zwischen A und B sowie der Winkel zwischen B und C bekannt sind. Dafür können Sie mit einem Online-Tool spielen, ohne Software zu installieren. Gehen Sie einfach auf die Seite http://www.montefiore.ulg.ac.be/~pierard/chained_correlations.php
quelle
Nehmen wir ein Beispiel:
Für einige x haben A und B eine signifikante Korrelation, in ähnlicher Weise haben A und C auch eine signifikante Korrelation, aber die Korrelation von B und C ist nicht signifikant.
Es ist also nicht unbedingt wahr, dass, wenn A und B korreliert sind und A und C korreliert sind, auch B und C korreliert sind.
Hinweis: Zum besseren Verständnis denken Sie bitte an dieses Beispiel für große Datenmengen.
quelle