Wie berechnet der Gower-Abstand die Differenz zwischen binären Variablen?

12

Ich habe 17 numerische und 5 binäre (0-1) Variablen mit 73 Beispielen in meinem Datensatz. Ich muss eine Clusteranalyse durchführen. Ich weiß, dass der Gower-Abstand eine gute Metrik für Datensätze mit gemischten Variablen ist. Aber ich konnte nicht verstehen , wie der Gower Abstand die Differenz zwischen berechnet Binärgrößen . Es scheint mir, dass es sich nicht von der euklidischen Distanz unterscheidet.

Emrah Bilgiç
quelle
Ihre Frage ist nicht ganz klar. Fragen Sie sich einfach: Wie berechnet der Gower-Abstand die Differenz zwischen binären Variablen? Was bedeutet "es gibt keinen Unterschied als euklidisch"?
Gung - Reinstate Monica
1
Vielen Dank. Entschuldigung, ich frage, wie Gower die Differenz zwischen binären Variablen berechnet. Ich meine, ich konnte die Unterschiede übrigens nicht verstehen. Euklidisch und Gower für binäre Variable.
Emrah Bilgiç
Haben Sie diese Seite gesucht Gower? stats.stackexchange.com/a/15313/3277
ttnphns
Ja, habe ich. Der euklidische Abstand beträgt 0, wenn beide Stichproben den gleichen Wert haben, 1, wenn nicht. Was ist mit Gower?
Emrah Bilgiç
4
@ EmrahBilgiç, Gower-Metrik ist Ähnlichkeit, nicht Entfernung. Es wird zu "Entfernung", wenn es von 1 abgezogen wird. Lesen Sie unter dem obigen Link, wie Binärdaten verarbeitet werden.
ttnphns

Antworten:

5

Wie wäre es mit binären Attributen mit den Werten "m" und "f" für "männlich" und "weiblich"?

Sie wissen, dass für eine dikotome Variable alles, was Sie herausholen können, "gleich" oder "anders" ist? Der entscheidende Punktunterschied zwischen Entfernungen besteht nicht darin, ob der Wert 1 oder 0 ist. aber wie mehrere Variablen kombiniert werden.

Hat aufgehört - Anony-Mousse
quelle
2

Die Gower-Entfernung verwendet Manhattan zur Berechnung der Entfernung zwischen fortlaufenden Datenpunkten und Dice zur Berechnung der Entfernung zwischen kategorialen Datenpunkten

Sanjeet
quelle