Unkorrelation + Gelenknormalität = Unabhängigkeit. Warum? Intuition und Mechanik

7

Zwei Variablen, die nicht korreliert sind, sind nicht unbedingt unabhängig, wie einfach durch die Tatsache veranschaulicht wird, dass und nicht korreliert, aber nicht unabhängig sind. Es wird jedoch garantiert, dass zwei Variablen, die nicht korreliert UND gemeinsam normalverteilt sind, unabhängig sind. Kann jemand intuitiv erklären, warum dies wahr ist? Was genau trägt die gemeinsame Normalität zweier Variablen zur Kenntnis der Nullkorrelation zwischen zwei Variablen bei, was uns zu dem Schluss führt, dass diese beiden Variablen unabhängig sein MÜSSEN?XX2

ColorStatistics
quelle
3
Es ist im Allgemeinen nicht der Fall, dass und nicht korreliert sind (es sei denn, Sie stellen bestimmte Bedingungen an das , die sie unkorrelieren würden, aber Sie erwähnen keine). XX2X
Glen_b -State Monica
Zurück zu der Tatsache, dass sich Korrelation auf lineare Beziehungen bezieht, erklären Sie bitte, wie X ^ 2 linear mit X zusammenhängt. Zweitens scheinen Sie zu behaupten, dass X ^ 2 und X nicht nur linear miteinander verbunden sein können, sondern dass sie es auch sind In Anbetracht der Verwendung des Wortes "allgemein" meistens linear verwandt. Bitte erkläre. Vielen Dank.
ColorStatistics
1
@Glen_b ist genau richtig: und sind nur dann unkorreliert, wenn Sie den Bereich von speziell festlegen . Zum Beispiel Pearsons für und wenn die Stichprobe von auf Werte von im Bereich größer als 1 beschränkt wird. Probieren Sie es selbst aus (R. ):XX2Xr0.98XX2XN(0,1)XX <- rnorm(n=10000); X2 <- X*X; cor(X[X>1],X2[X>1])
Alexis
1
@Alexis Es ist nicht nur der Bereich, sondern auch die Verteilung der Wahrscheinlichkeiten auf diese Werte innerhalb des Bereichs. Wenn Sie die Verteilung ändern, ändern Sie die Korrelation.
Glen_b -State Monica
3
@ColorStatistics Korrelation ist der Grad der linearen Beziehung, ja. Die Projektion von auf kann jedoch eine wesentliche lineare Komponente beinhalten. Wenn Sie ein Beispiel mit einer hohen linearen Korrelation zwischen einer Variablen und ihrem Quadrat sehen möchten, lassen Sie die Werte 0 und 1 mit gleicher Wahrscheinlichkeit annehmen (z. B. die Anzahl der Köpfe beim Werfen einer einzelnen fairen Münze aufzeichnen). Dann ist corr (!). Wenn Sie die Verteilung von angeben können, können Sie dafür sorgen, dass die Korrelation zwischen und einen beliebigen Wert zwischen und annimmt . ... ctdx2xX(X,X2)=1XXX211
Glen_b - Monica neu starten

Antworten:

6

Die gemeinsame Wahrscheinlichkeitsdichtefunktion (pdf) der bivariaten Normalverteilung ist:

f(x1,x2)=12πσ1σ21ρ2exp[z2(1ρ2)],

wo

z=(x1μ1)2σ122ρ(x1μ1)(x2μ2)σ1σ2+(x2μ2)2σ22.
Wenn , .ρ=0
f(x1,x2)=12πσ1σ2exp[12{(x1μ1)2σ12+(x2μ2)2σ22}]=12πσ1exp[12{(x1μ1)2σ12}]12πσ2exp[12{(x2μ2)2σ22}]=f(x1)f(x2)

Sie sind also unabhängig.

user158565
quelle
Ich war zwei Zeilen langsamer als du! (+1)
Jbowman
1
Danke euch allen. Eleganter Beweis. Es ist jetzt klar. Es scheint mir, dass ich angesichts des Beweisflusses hätte fragen sollen, welche Kenntnis der Nullkorrelation zur Kenntnis der Gelenknormalität beiträgt und nicht umgekehrt.
ColorStatistics
1
Was ist mit einer intuitiven Erklärung, warum es wahr ist?
ColorStatistics
Vielleicht gibt es keine intuitive einfache Erklärung.
user158565
Könnten wir eine gewisse Intuition in Bezug auf die Argumentation bekommen, dass die höheren (als 2) Momente eines Gaußschen Prozesses alle Null sind, und wenn wir die Nullkorrelationsbedingung (Moment 2) addieren, werden alle Momente größer als Eins auf Null festgelegt?
ColorStatistics
2

Die gemeinsame Normalität zweier Zufallsvariablen kann auf zwei einfache Arten charakterisiert werden:X,Y

  • Für jedes Paar von (nicht zufälligen) reellen Zahlen hat eine univariate Normalverteilung.a,baX+bY

  • Es gibt Zufallsvariablen und reelle Zahlen so dassZ1,Z2i.i.d.N(0,1)a,b,c,d

    X=aZ1+bZ2and Y=cZ1+dZ2.

Dass die erste davon aus der zweiten folgt, ist leicht zu zeigen. Dass die zweite aus der ersten folgt, erfordert mehr Arbeit, und vielleicht werde ich bald darauf posten. . .

Wenn der zweite wahr ist, dann istcov(X,Y)=ac+bd.

Wenn diese Kovarianz die Vektoren orthogonal zueinander. Dann ist ein skalares Vielfaches der orthogonalen Projektion von auf und auf0,(a,b), (c,d)X(Z1,Z2)(a,b)Y(c,d).

Verbinden Sie nun die Tatsache der Orthogonalität mit der Kreissymmetrie der Gelenkdichte von zu sehen, dass die Verteilung von der Verteilung von zwei Zufallsvariablen entsprechen sollte, von denen eine ein Skalar ist Vielfaches der orthogonalen Projektion von auf die Achse, dh es ist ein skalares Vielfaches von und das andere ist ähnlich ein skalares Vielfaches von(Z1,Z2),(X,Y)(Z1,Z2)xZ1,Z2.

Michael Hardy
quelle