Haben Sie aus Ihrer Erfahrung Vorschläge zur Darstellung zeitlich wechselnder Korrelationsmatrizen? Ich habe mir /quant/1565/how-do-i-graphically-represent-the-evolution-of-a-covariance-matrix-over-time angesehen , konnte aber keine finden guter Artikel. Ich stelle diese Frage, weil ich auf dem Gebiet der Datenanalyse ziemlich neu bin und das einzige Buch, das ich bisher gelesen habe, Wickhams ist ggplot2
. Also dachte ich daran, Experten danach zu fragen.
Ich würde mich über jede Hilfe sehr freuen.
correlation
data-visualization
Wachturm
quelle
quelle
Antworten:
Hier gibt es eine Reihe von Problemen (und ob Sie sie verwenden,
ggplot2
scheint mir völlig orthogonal zu ihnen zu sein). Erkennen Sie zunächst, dass Korrelationen nicht unbedingt intuitiv und linear skaliert werden müssen (zum großen Teil, weil ihr möglicher Bereich begrenzt ist). Es lohnt sich darüber nachzudenken, wie Sie die Werte darstellen möchten. Zum Beispiel könnten Sie verwenden:Ich weiß nicht wirklich etwas über Ihre Situation, daher fällt es mir schwer zu sagen, aber meine Standardeinstellung wäre die Verwendung der transformierten Scores ( ).zr
Als nächstes müssen Sie entscheiden, was mit den Daten geschehen soll (überhaupt oder mehr oder weniger prominent). Möchten Sie beispielsweise die absoluten Größen der Werte oder nur deren Änderungen einbeziehen (vgl. Niveaus vs. Änderungen in der Wirtschaft)? Interessieren Sie sich hauptsächlich für die Größenordnungen der Änderungen (dh Absolutwerte), ob sie zunehmen oder abnehmen (die Vorzeichen, entweder im absoluten Sinne oder in Richtung oder weg von keiner Korrelation) oder beides?
Vorausgesetzt , dass Sie eine Korrelation visualisieren möchten Matrix (dh ein Satz von Korrelationen), ist es zu bedenken , dass sie nicht sein wird , unabhängig . Beachten Sie, dass eine Änderung nur einer Variablen Auswirkungen auf mehrere Korrelationen hat, selbst wenn die anderen Variablen über die Zeit konstant sind. Es kommt also wieder darauf an, ob das für Sie wichtig ist.
Mit anderen Worten, es ist wichtig , genau herauszufinden, was Ihnen wirklich wichtig ist. Es wird keine Visualisierung geben, die alle diese Facetten erfasst.
Aus Ihrem Kommentar geht hervor, dass Sie vorher und nachher nur zwei Korrelationsmatrizen haben werden. Das vereinfacht die Dinge. Ohne Informationen über Ihre Situation, Daten oder Ziele würde ich wahrscheinlich ein Streudiagramm mit vorher und nachher auf der X-Achse und auf der Y-Achse und den beiden Punkten , die dieselbe Korrelation darstellen, die durch eine Linie verbunden sind Segment. Betrachten Sie dieses in R codierte Beispiel:zr
Die obigen Abbildungen zeigen sowohl die Ebenen der Korrelationen als auch das Ausmaß der Änderung. Sie können verschiedene Merkmale sehen, z. B. eine Konvergenz in Richtung . Der Unterschied zwischen der Verwendung von und besteht darin, dass die Punkte vorher gleichmäßiger verteilt sind. Der Abstand zwischen und beispielsweise dem Abstand zwischen und . Andererseits sind für die Korrelationen naher=0 zr r r 0 .4 .4 .8 zr 0 sind zusammengeklumpt und die starke Korrelation ist viel weiter vom Rest entfernt. Was diese Zahlen nicht erfassen, ist die Nichtunabhängigkeit dieser Linien. Sie können in der Heatmap unten sehen (unter Verwendung der absoluten Werte der Unterschiede in ), dass die größeren Änderungen mit Variable 5 verbunden sind. zr
quelle
Meiner Meinung nach ist es besser, die Auswirkung von Parameteränderungen (ein Proxy für lokale Korrelationen) zu quantifizieren, als einen visuellen Versuch zu unternehmen, da Versuche visueller Vergleiche sehr subjektiv sein können. Ihre Frage ähnelt "Wie teste ich, ob die Parameter von mir Modellwechsel im Laufe der Zeit ". Ich habe den Chow-Test so programmiert, dass festgestellt wird, zu welchem Zeitpunkt die Parameter am stärksten voneinander abweichen. Dies zu finden führt zu einem direkten Signifikanztest, der möglicherweise zu dem Schluss führt, dass "frühere Daten" beiseite gelegt werden sollten.
quelle