Mein Wunsch ist es, die zeitliche Komplexität mehrerer Clustering-Ansätze zu beschreiben. Angenommen, wir haben Datenpunkte im dimensionalen Raum.m
Nehmen wir weiter an, dass die paarweise Unähnlichkeitsmatrix von Dimensionen bereits berechnet wurde und dass wir bereits Schritte ausgegeben haben . Was ist dann die zeitliche Komplexität gerade vonn × n O ( m ⋅ n 2 )
- hierarchisches Clustering (HC) unter Verwendung der Ward-Verknüpfung
- HC mit vollständiger Verknüpfung
- HC unter Verwendung einer durchschnittlichen Verknüpfung
- HC mit einfacher Verknüpfung
- medoid Ansatz
- bedeutet Ansatz
Gibt es einen Vorteil, wenn die Unähnlichkeitsmatrix noch nicht berechnet wurde? Soweit ich weiß, ist es für den HC- und Medoid-Ansatz notwendig, aber nicht für Mittel?k k
Danke für deine Hilfe!
Antworten:
Single Linkage Clustering entspricht fast dem Minimum von Spanning Tree in vollständigen Diagrammen, einfache O (n ^ 2) -Zeit. Informationen zur O (n ^ 2) -Zeit für andere agglomerative Clustering-Methoden (einschließlich der ziemlich sicheren und vollständigen Verknüpfung) finden Sie in meinem Artikel "Schnelles hierarchisches Clustering und andere Anwendungen dynamischer engster Paare", SODA '98 und JEA '00.
quelle
quelle