Ich benutze bedeutet Clustering, um Lautsprecherstimmen zu gruppieren. Wenn ich eine Äußerung mit gruppierten Sprecherdaten vergleiche, erhalte ich eine (euklidische entfernungsbasierte) durchschnittliche Verzerrung. Dieser Abstand kann im Bereich von . Ich möchte diesen Abstand in einen Ähnlichkeitswert umrechnen . Bitte leiten Sie mich, wie ich dies erreichen kann.
clustering
k-means
distance
euclidean
Muhammad
quelle
quelle
Sie könnten auch verwenden: , woSiegewünschte Abstandsfunktion ist.1edist
dist
quelle
Es hört sich so an, als ob Sie eine Ähnlichkeit mit dem Kosinus wünschen, was selbst eine Ähnlichkeitsbewertung im Einheitsintervall ist. Tatsächlich besteht eine direkte Beziehung zwischen euklidischer Distanz und Kosinusähnlichkeit!
Beachten Sie, dass
Während die Cosinusähnlichkeit wobeiθder Winkel zwischenxundx'ist.
Wann wir haben | | x - x ′ | | 2 = 2 ( 1 - f ( x , x ' ) ) und f ( x , x ' ) = x T x ' ,||x||=||x′||=1,
so
in diesem Spezialfall.
Aus rechnerischer Sicht kann es effizienter sein, statt der euklidischen Distanz nur den Kosinus zu berechnen und dann die Transformation durchzuführen.
quelle
How about a Gaussian kernel ?
The distance∥x−x′∥ is used in the exponent. The kernel value is in the range [0,1] . There is one tuning parameter σ . Basically if σ is high, K(x,x′) will be close to 1 for any x,x′ . If σ is low, a slight distance from x to x′ will lead to K(x,x′) being close to 0.
quelle
If you are using a distance metric that is naturally between 0 and 1, like Hellinger distance. Then you can use 1 - distance to obtain similarity.
quelle