Gibt es eine Beziehung zwischen Cosinus-Ähnlichkeit, Pearson-Korrelation und Z-Score?

16

Ich frage mich, ob es einen Zusammenhang zwischen diesen drei Maßnahmen gibt. Ich kann nicht scheinen, eine Verbindung zwischen ihnen herzustellen, indem ich mich auf die Definitionen beziehe (möglicherweise, weil ich mit diesen Definitionen neu bin und es ein bisschen schwer habe, sie zu erfassen).

Ich weiß, dass der Bereich der Cosinus-Ähnlichkeit zwischen 0 und 1 liegen kann und dass die Pearson-Korrelation zwischen -1 und 1 liegen kann, und ich bin mir nicht sicher, welchen Bereich der z-Score hat.

Ich weiß jedoch nicht, wie ein bestimmter Wert der Cosinus-Ähnlichkeit etwas über die Pearson-Korrelation oder den Z-Score aussagen könnte und umgekehrt?

Jaken Herman
quelle
1
z Punktzahl von was ? z-Werte von einigen Dingen können mit der Pearson-Korrelation zusammenhängen, Z-Werte von anderen Dingen möglicherweise nicht. Wenn Sie beispielsweise Ihre ursprünglichen Variablen intern standardisieren, ist die Pearson-Korrelation zwischen x und y das erwartete Produkt ihrer Z-Scores. Oder Sie sprechen über z-Scores von Pearson-Korrelationen (Pearson-Korrelationen abzüglich ihrer Erwartung unter bestimmten Bedingungen geteilt durch den Standardfehler der Pearson-Korrelation), die sicherlich mit der Pearson-Korrelation zusammenhängen würden.
Glen_b
1
Direkte Beziehung: stats.stackexchange.com/a/22520/3277
ttnphns

Antworten:

28

Die Cosinusähnlichkeit zwischen zwei Vektoren und b ist nur der Winkel zwischen ihnen cos θ = a bab In vielen Anwendungen, die Kosinusähnlichkeit verwenden, sind die Vektoren nicht negativ (z. B. ein Termfrequenzvektor für ein Dokument), und in diesem Fall ist die Kosinusähnlichkeit auch nicht negativ.

cosθ=abab

Für einen Vektor der " z- Punkt" -Vektor typischerweise definiert als z = x - ˉ xxz mit ˉ x =1

z=xx¯sx
unds 2 x = ¯ ( x - ˉ x ) 2 sind der Mittelwert undStandardabweichung vonx. Also hatzden Mittelwert 0 und die Standardabweichung 1, dhzxist diestandardisierteVersion vonx.x¯=1nixisx2=(xx¯)2¯xzzxx

Für zwei Vektoren und y , dessen Korrelationskoeffizient wäre ρ x , y = ¯ ( z x Z y )xy

ρx,y=(zxzy)¯

Wenn der Vektor Mittelwert Null hat, ist seine Varianz s 2 a = 1a, so dass ihr Einheitsvektor und z-Score wird durchBeziehungwerden a =asa2=1na2

a^=aa=zan

Also wenn die Vektoren ab

TL; DR Cosinus-Ähnlichkeit ist ein Skalarprodukt von Einheitsvektoren. Die Pearson-Korrelation ist die Kosinusähnlichkeit zwischen zentrierten Vektoren. Die "Z-Score-Transformation" eines Vektors ist der auf eine Norm von skalierte zentrierte Vektorn .

GeoMatt22
quelle
+1. latexnazi comment: \| often looks better than ||, and \lVert ... \rVert is the best way to write it.
amoeba says Reinstate Monica