Ich frage mich, ob es einen Zusammenhang zwischen diesen drei Maßnahmen gibt. Ich kann nicht scheinen, eine Verbindung zwischen ihnen herzustellen, indem ich mich auf die Definitionen beziehe (möglicherweise, weil ich mit diesen Definitionen neu bin und es ein bisschen schwer habe, sie zu erfassen).
Ich weiß, dass der Bereich der Cosinus-Ähnlichkeit zwischen 0 und 1 liegen kann und dass die Pearson-Korrelation zwischen -1 und 1 liegen kann, und ich bin mir nicht sicher, welchen Bereich der z-Score hat.
Ich weiß jedoch nicht, wie ein bestimmter Wert der Cosinus-Ähnlichkeit etwas über die Pearson-Korrelation oder den Z-Score aussagen könnte und umgekehrt?
correlation
z-score
cosine-similarity
Jaken Herman
quelle
quelle
Antworten:
Die Cosinusähnlichkeit zwischen zwei Vektoren und b ist nur der Winkel zwischen ihnen cos θ = a ⋅ ba b
In vielen Anwendungen, die Kosinusähnlichkeit verwenden, sind die Vektoren nicht negativ (z. B. ein Termfrequenzvektor für ein Dokument), und in diesem Fall ist die Kosinusähnlichkeit auch nicht negativ.
Für einen Vektor der " z- Punkt" -Vektor typischerweise definiert als z = x - ˉ xx z
mit ˉ x =1
Für zwei Vektoren und y , dessen Korrelationskoeffizient wäre ρ x , y = ¯ ( z x Z y )x y
Wenn der Vektor Mittelwert Null hat, ist seine Varianz s 2 a = 1a , so dass ihr Einheitsvektor und z-Score wird durchBeziehungwerden
a =as2a=1n∥a∥2
Also wenn die Vektorena b
TL; DR Cosinus-Ähnlichkeit ist ein Skalarprodukt von Einheitsvektoren. Die Pearson-Korrelation ist die Kosinusähnlichkeit zwischen zentrierten Vektoren. Die "Z-Score-Transformation" eines Vektors ist der auf eine Norm von skalierte zentrierte Vektorn−−√ .
quelle
\|
often looks better than||
, and\lVert ... \rVert
is the best way to write it.