Clustering mit asymmetrischen Abstandsmaßen

9

Wie gruppieren Sie ein Feature mit einem asymmetrischen Abstandsmaß?

Angenommen, Sie gruppieren ein Dataset mit Wochentagen als Feature. Die Entfernung von Montag bis Freitag entspricht nicht der Entfernung von Freitag bis Montag.

Wie integrieren Sie dies in das Abstandsmaß des Clustering-Algorithmus?

Michael
quelle

Antworten:

3

Wenn der MF-Abstand asymmetrisch ist, weil sich die Zukunft von der Vergangenheit unterscheidet, ist eine echte asymmetrische Clusterbildung erforderlich. Zunächst muss eine asymmetrische Distanzfunktion definiert werden.

Eine Möglichkeit zur asymmetrischen Clusterbildung bei gegebener Abstandsfunktion besteht darin, die Originaldaten in einen neuen Koordinatenraum einzubetten. Siehe "Geometrische Strukturen einiger Nicht-Distanzmodelle für asymmetrisches MDS" von Naohito Chino und Kenichi Shiraiwa, Behaviormetrika, 1992 ( pdf ). Dies nennt man HCM (das hermitische kanonische Modell).

H.

H.ichj=12[d(xich,xj)+d(xj,xich)]]+ich12[d(xich,xj)- -d(xj,xich)]]

Dies transformiert die Daten in einen Raum komplexer Zahlen. Sobald die Daten eingebettet sind, beträgt der Abstand zwischen den Objekten x und y nur x * y, wobei * die konjugierte Transponierte ist. Zu diesem Zeitpunkt können Sie k-means für die komplexen Vektoren ausführen.

Spektrale asymmetrische Clusterbildung wurde ebenfalls durchgeführt, siehe die Arbeit von Stefan Emilov Atev, "Verwenden von Asymmetrie bei der spektralen Clusterbildung von Trajektorien", University of Minnesota, 2011, die MATLAB-Code für einen speziellen Algorithmus liefert.

andy_a
quelle
1

Sie können eine Art Mittelwert nehmen (wie einen arithmetischen Mittelwert oder für Wahrscheinlichkeitsverteilungen die Quadratwurzel der Jensen-Shannon-Divergenz).

Cyborg
quelle
1

Sie sollten sich die zirkulären Statistiken ansehen (wenn Sie "innerhalb" einer Tunning-Woche arbeiten möchten).

Lionel
quelle
1

X.X.T.X.

|Tage auseinander|

xD.

Jessica Collins
quelle