Der beste Weg zum Clustering einer Adjazenzmatrix

8

Es fiel mir schwer, resultierende Cluster einer Adjazenzmatrix zu interpretieren. Ich habe 200 relativ große Matrizen, die Themen darstellen, die Teilkorrelationen (z-Scores) von Zeitreihen (neuronale Daten) enthalten. Ziel ist es, diese 210 Matrizen zu gruppieren und potenzielle unentdeckte Gemeinschaften zu erkennen. Also habe ich weitere Teilkorrelationsberechnungen durchgeführt, die zu einer Adjazenzmatrix von 200 x 200 führten. Immer wenn ich einen Community-Erkennungsalgorithmus (z. B. Newmanns) ausführe, fallen kaum interpretierbare Communitys auf.

Die Frage ist, welche Art von statistischen Tests zeigen, ob diese Gemeinschaften oder Cluster überhaupt von Bedeutung sind. und wenn ja, gibt es systematische Möglichkeiten, die Interpretation zu erarbeiten?

Fahd
quelle
Soweit mir bekannt ist, gibt es dafür keinen einzigen „richtigen Weg“. Ein Ansatz wäre, so etwas wie hierarchisches Clustering auf der Distanzmatrix 1|ρ|wo ρ ist die Korrelationen. Die andere Sache ist, ob Ihre letztere Korrelationsmatrix sinnvolle Beziehungen erfasst. Welche Schritte wurden unternommen, um es zu produzieren?
Vermutungen
Vielen Dank. In Bezug auf Ihre Frage habe ich jede Zeile (oder die Daten des Subjekts) mit jedem anderen Subjekt unter Verwendung von Corrcoef (einfache Korrelation) korreliert, und so habe ich die Ergebnisse erhalten. Ich versuche die Muster zu erkennen und deshalb musste ich wieder korrelieren.
Fahd
Im OP wird vorgeschlagen, dass die Subjektdaten eine Matrixbewertung haben. Wie wird dies zu einer einzelnen Zeile pro Subjekt?
Vermutungen

Antworten:

2

Ich habe in der Vergangenheit einige Arbeiten zum spektralen Clustering durchgeführt, die hier von Nutzen sein könnten. Die Grundidee ist, dass man die Adjazenzmatrix verwenden kann, um die sogenannte Laplace-Matrix zu bilden:

L=ID1/2AD1/2

Sie können selbst überprüfen, ob der niedrigste Eigenwert des Laplace Null ist. Der erste Eigenwert ungleich Null wird häufig als algebraische Konnektivität bezeichnet, und der entsprechende Fremdvektor hat einen positiven und einen negativen Teil, die zwei Partitionen des zugrunde liegenden Graphen entsprechen. Grob gesagt ist die Größe des ersten Fremdwerts ungleich Null ein Maß für die Stärke der Verbindungen zwischen den beiden Partitionen. Vielleicht können Sie diesen Ansatz rekursiv anwenden oder die ersten Fremdwerte ungleich Null des Laplace betrachten. Der folgende Wikipedia-Artikel über spektrale Clusterbildung ist ein guter Anfang.(B1,B2)

Abbas
quelle
2

Ich sehe im Moment das gleiche Problem. Aus der kurzen Übersicht geht hervor, dass Spektralclustering die "natürlichste" Methode zur Analyse einer Adjazenzmatrix ist. Weitere Informationen finden Sie in diesem Blogbeitrag .

Hanan Shteingart
quelle
0

Alternativ ... Neuronale Daten (real oder künstlich) sind häufig eine stark komprimierte Darstellung von Daten, was bedeutet, dass die Daten sehr zufällig sind, was bedeutet, dass Sie keine Korrelationen finden. Welche du hast!! Herzliche Glückwünsche! :) :)

Strahl
quelle