Basis des Pearson-Korrelationskoeffizienten

8

Der Pearson-Korrelationskoeffizient wird unter Verwendung der Formel berechnet . Wie enthält diese Formel die Information, dass die beiden Variablen und korreliert sind oder nicht? Oder wie erhalten wir diese Formel für den Korrelationskoeffizienten? XY.r=cov(X,Y)var(X)var(Y)XY

Pranphy
quelle

Antworten:

8

Was zählt, ist . Nenner cov(X,Y) dient zum Entfernen von Maßeinheiten (wenn beispielsweiseXin Metern undYin Kilogrammgemessen wird, wirdcov(X,Y)in Meter-Kilogramm gemessen, was schwierig ist zu verstehen) und zur Standardisierung (cor(X,Y)liegt zwischen -1 und 1, unabhängig davon, welche Variablenwerte Sie haben).var(X)var(Y)XYcov(X,Y)cor(X,Y)

Nun zurück zu . Dies zeigt , wie Variablen variieren gemeinsam über ihre Mittel, damit Co-Varianz . Nehmen wir ein Beispiel.cov(X,Y)Geben Sie hier die Bildbeschreibung ein

X¯Y¯XiYi(XiX¯)(YiY¯)(XiX¯)(YiY¯)ist positiv. Im Gegensatz dazu sind oben links und unten rechts Bereiche, in denen dieses Produkt negativ ist.

cov(X,Y)=1n1i=1n(XiX¯)(YiY¯)(XiX¯)(YiY¯)(X¯,Y¯)

Als letzte Anmerkung zeigt die Kovarianz nur die Stärke einer linearen Beziehung. Wenn die Beziehung nicht linear ist, kann die Kovarianz sie nicht erkennen.

danas.zuokas
quelle
covariance shows only the strength of a linear relationshipDas ist nicht wahr. Cov reagiert sowohl auf die Stärke der Linearität als auch auf die Größe der Variation. Nehmen Sie X und Y, streng linear verwandt. Ziehen Sie dann zwei Extrempunkte in X auseinander, um var (X) zu vergrößern. Die bivariate Wolke ist nicht mehr linear - sie ist nur noch monoton; dennoch wurde cov (X, Y) größer! Wenn wir nun jedoch die Summe var (X) + var (Y) auf ihren ursprünglichen Wert zurückbringen, fällt cov (X, Y) unter und unter ihren Anfangswert, was die Tatsache widerspiegelt, dass wir zuvor die Linearität gestört haben.
ttnphns
Wow, das ist interessant.
danas.zuokas
3

SCP(X,Y)SS(X)SS(Y)

Kosinus ist nun das Maß für die Verhältnismäßigkeit ; cos (X, Y) = 1, wenn und nur wenn Xi = kYi , dh wenn alle Punkte ( i ) auf einer geraden Linie liegen, die vom Ursprung des X-Y-Koordinatensystems kommt. Wenn entweder die Linie nicht durch den Ursprung kommt oder Punkte von der geraden Linie abweichen, wird cos kleiner. Da Pearson r der cos der Wolke ist, die sowohl auf der X- als auch auf der Y- Achse zentriert wurde, kommt die Linie unvermeidlich durch den Ursprung; und daher kann nur die Abweichung von Punkten vom Liegen auf der geraden Linie r verringern : r ist das Maß vonLinearität .

ttnphns
quelle
1

Wenn r = 1 ist, gibt es eine perfekte lineare Korrelation, wenn r = -1 ist, gibt es eine perfekte negative lineare Korrelation, wenn r = 0 ist, gibt es keine lineare Korrelation. Der Grund, warum wir durch Standardabweichungen von X und Y dividieren, besteht darin, ein Maß zu erhalten, das nicht vom Maßstab abhängt.

In diesem Thread finden Sie detailliertere Antworten.

Akavall
quelle