Lassen Sie uns eine quadratische symmetrische Matrix quadratischer euklidischer Abstände zwischen Punkten und einem Vektor mit einer Länge von , die die Cluster- oder Gruppenzugehörigkeit ( Cluster) der Punkte anzeigt ; Ein Cluster kann aus Punkt bestehen.
Was ist hier die effizienteste oder wirklich effizienteste (in Bezug auf die Geschwindigkeit) Methode, um Entfernungen zwischen den Cluster-Schwerpunkten zu berechnen ?
Bisher habe ich in dieser Situation immer eine Hauptkoordinatenanalyse durchgeführt. PCoA oder Torgersons MDS bedeutet , zuerst in die Matrix der Skalarprodukte ("doppelte Zentrierung") umzuwandeln und dann eine PCA davon durchzuführen. Auf diese Weise erstellen wir Koordinaten für die Punkte in dem euklidischen Raum, den sie überspannen. Danach ist es einfach, die Abstände zwischen den Zentroiden auf die übliche Weise zu berechnen - wie Sie es mit Daten tun würden . PCoA muss eine Eigenzerlegung oder SVD des symmetrischen positiven Semidefinits , abergrouped points x variables
n x n
kann ziemlich groß sein. Außerdem ist die Aufgabe keine Dimensionsreduktionsaufgabe, und wir benötigen diese orthogonalen Hauptachsen tatsächlich nicht. Ich habe das Gefühl, dass diese Zerlegungen ein Overkill sein könnten.
Haben Sie Kenntnisse oder Ideen zu einem möglicherweise schnelleren Weg?
quelle