Ich möchte eine grafische Darstellung der Korrelationen in Artikeln erhalten, die ich bisher gesammelt habe, um die Beziehungen zwischen Variablen leicht untersuchen zu können. Früher habe ich ein (unordentliches) Diagramm gezeichnet, aber jetzt habe ich zu viele Daten.
Grundsätzlich habe ich einen Tisch mit:
- [0]: Name der Variablen 1
- [1]: Name der Variablen 2
- [2]: Korrelationswert
Die "Gesamt" -Matrix ist unvollständig (z. B. habe ich die Korrelation von V1 * V2, V2 * V3, aber nicht V1 * V3).
Gibt es eine Möglichkeit, dies grafisch darzustellen?
quelle
ggfluctuation
, hatte das noch nie gesehen! Dieser Beitrag hat anderen nützlichen Code, um diese Art von Daten zu visualisieren: stackoverflow.com/questions/5453336/…hclust(…)$order
) [ stat.ethz.ch/R-manual/R-devel/library/stats/html/hclust.html] neu anordnen, ist die Visualisierung häufig einfacher zu überblicken.mixOmics::cim
Funktion ist dafür sehr gut. Ein verwandtes Problem wurde hier diskutiert, stats.stackexchange.com/questions/8370/… .Ihre Daten können wie sein
Sie können Ihren langen Tisch mit dem folgenden R-Code in einen breiten Tisch umordnen
Du kriegst
Jetzt können Sie Techniken zur Visualisierung von Korrelationsmatrizen verwenden (zumindest solche, die mit fehlenden Werten umgehen können).
quelle
reshape
Paket kann auch nützlich sein. Wenn Sie habene
, denken Sie an etwas wielibrary(reshape) cast(melt(e), name1 ~ name2)
Das
corrplot
Paket ist eine nützliche Funktion zur Visualisierung von Korrelationsmatrizen. Es akzeptiert eine Korrelationsmatrix als Eingabeobjekt und verfügt über mehrere Optionen zum Anzeigen der Matrix selbst. Eine nette Funktion ist, dass es Ihre Variablen mithilfe von hierarchischen Clustering- oder PCA-Methoden neu anordnen kann.In der akzeptierten Antwort in diesem Thread finden Sie eine Beispielvisualisierung.
quelle