Ich bin daran interessiert zu wissen, was wirklich in Hellinger Distance passiert (in einfachen Worten). Darüber hinaus interessiert mich auch, welche Arten von Problemen wir mit Hellinger Distance lösen können. Was sind die Vorteile von Hellinger Distance?
machine-learning
data-mining
text-mining
distance
Smith Volka
quelle
quelle
Antworten:
Die Hellinger-Distanz ist eine Metrik zur Messung der Differenz zwischen zwei Wahrscheinlichkeitsverteilungen. Es ist das probabilistische Analogon der euklidischen Distanz .
Dies ist nützlich, wenn der Unterschied zwischen zwei Wahrscheinlichkeitsverteilungen quantifiziert wird. Zum Beispiel, wenn Sie eine Verteilung für Benutzer und Nichtbenutzer eines Dienstes schätzen. Wenn der Hellinger-Abstand zwischen diesen Gruppen für einige Features gering ist, sind diese Features für die Segmentierung statistisch nicht nützlich.
quelle