Betrachten Sie den Kontext eines Dendrogramm-Clusters. Nennen wir ursprüngliche Unterschiede die Abstände zwischen den Individuen. Nach der Erstellung des Dendrogramms definieren wir die kophenetische Unähnlichkeit zwischen zwei Individuen als den Abstand zwischen den Clustern, zu denen diese Individuen gehören.
Einige Leute denken, dass die Korrelation zwischen den ursprünglichen Unähnlichkeiten und den kophenetischen Unähnlichkeiten (als kophenetische Korrelation bezeichnet ) ein "Eignungsindex" der Klassifikation ist. Das klingt für mich total rätselhaft. Mein Einwand beruht nicht auf der besonderen Wahl der Pearson-Korrelation, sondern auf der allgemeinen Vorstellung, dass ein Zusammenhang zwischen den ursprünglichen Unähnlichkeiten und den kophenetischen Unähnlichkeiten mit der Eignung der Klassifikation zusammenhängen könnte.
Stimmen Sie mir zu oder könnten Sie ein Argument vorbringen, das die Verwendung der kophenetischen Korrelation als Eignungsindex für die Dendrogrammklassifikation unterstützt?
quelle
general idea that any link between the original dissimilarities and the cophenetic dissimilarities could be related to the suitability of the classification
. Die Klassifizierung sollte die ursprünglichen Unterschiede widerspiegeln. Das Grundmerkmal der dendrogramischen Klassifikation ist die kophenetische Unähnlichkeit. Gibt es etw. falsch?Antworten:
Für mich ist nicht richtig klar, was damit gemeint ist. So wie ich es verstanden habe, ist das so
ist ein Maß für die hierarchische Struktur zwischen den Beobachtungen , dh ihre Abstände. Das heißt, die Unterschiede zu Beobachtungen in einem anderen Cluster sind vorzugsweise ähnlich. Wenn man die Datensätze A und B betrachtet, die unter Verwendung der euklidischen Entfernung und der vollständigen Verknüpfung geclustert wurden, kann man sehen, dass die kophenetische Korrelation von A höher ist als die von B. In einer Hierarchie gibt es Ebenen. Der CC gibt also an, ob die Entfernungen zu Beobachtungen auf derselben Ebene (Cluster) ähnlich sind.
Der Vollständigkeit halber: Die kophenetischen Korrelationen sind CC (A) = 0,936 und CC (B) = 0,691
quelle