Angenommen, ich habe die folgenden vier dimensionalen Daten, wobei die ersten drei als Koordinaten und die letzte als Werte betrachtet werden können.
c1, c2, c3, value
1, 2, 6, 0.456
34, 34, 12 0.27
12, 1, 66 0.95
Wie lässt sich der Effekt der ersten drei Koordinaten auf den letzten Wert besser visualisieren?
Ich kenne drei Methoden.
Eine ist 3D-Plot für die ersten drei Koordinaten mit der Größe der Punkte als den vier Wert. Es ist jedoch nicht so einfach, den Trend in den Daten zu erkennen.
Zum anderen wird eine Reihe von 3D-Diagrammen verwendet, für die jeweils eine Koordinate festgelegt ist.
Ein anderes kann ein sogenanntes "Gittergraph" im Gitter von R sein. Nicht sicher, ob es für diesen Zweck ist, aber es scheint so.
r
data-visualization
Tyler 主 傲 国 国
quelle
quelle
Antworten:
Wenn die ersten drei nur räumliche Koordinaten sind und die Daten dünn sind, können Sie einfach ein 3D-Streudiagramm mit unterschiedlich großen oder farbigen Punkten für den Wert erstellen.
Sieht ungefähr so aus: (Quelle: gatech.edu )
Wenn Ihre Daten in der Natur kontinuierlich sein sollen und sich in einem Gitter befinden, können Sie mit Marching Cubes mehrere Isokonturen der Daten zeichnen .
Ein anderer Ansatz, wenn Sie dichte 4D-Daten haben, besteht darin, mehrere 2D- "Schnitte" der in 3D eingebetteten Daten anzuzeigen. Es wird ungefähr so aussehen:
quelle
Haben Sie vier quantitative Variablen? Wenn ja, versuchen Sie es mit Touren, parallelen Koordinatendiagrammen und Streudiagramm-Matrizen. Mit dem Paket tourr (und tourrGui) in R werden Touren ausgeführt, die sich im Grunde genommen in großen Dimensionen drehen. Sie können wählen, ob Sie in 1D, 2D oder mehr projizieren möchten, und es gibt ein JSS-Dokument, das Sie lesen können, um mit dem Zitieren des Pakets zu beginnen. Parallele Koordinatendiagramme und Streudiagramm-Matrizen sind im Paket GGally enthalten, ebenso Streudiagramm-Matrizen im Paket YaleToolkit. Unter http://www.ggobi.org finden Sie auch Videos und weitere Dokumentationen zu all diesen Themen.
Wenn Ihre Daten vollständig kategorisiert sind, sollten Sie Mosaikdiagramme oder Varianten verwenden. Schauen Sie sich das productplots-Paket in R an, auch vcd hat einige sinnvolle Funktionen, oder das ggparallel-Paket, um das Äquivalent von parallelen Koordinatendiagrammen für kategoriale Daten zu erstellen. Außerdem hat das extracat-Paket einige Funktionen zum Anzeigen kategorialer Daten.
Ich habe die Frage ursprünglich falsch verstanden, weil ich bei der Frage stehen geblieben bin und es versäumt habe, die vollständige Beschreibung zu lesen. Ähnlich wie im folgenden Ansatz (Einfärben von Punkten in 3D) können Sie mithilfe des verknüpften Pinsels Funktionen untersuchen, die in hochdimensionalen Räumen definiert sind. Schauen Sie sich hier das Video an , das dies für eine multivariate 3D-Normalfunktion zeigt. Der Pinsel malt Punkte mit hoher Dichte (hohe Funktionswerte) und bewegt sich dann zu niedrigeren und niedrigeren Dichtewerten (niedrige Funktionswerte). Die Orte, an denen die Funktion abgetastet wird, werden in einem rotierenden 3D-Streudiagramm unter Verwendung der Tour angezeigt, mit dem auch Domänen mit 4, 5 oder mehr Dimensionen betrachtet werden können.
quelle
Versuchen Sie es mit Chernoff-Gesichtern . Die Idee ist, die Variablen an die Gesichtsmerkmale anzuhängen. Zum Beispiel würde die Größe des Lächelns eine Variable sein, die Rundheit des Gesichts ist eine andere usw. So lächerlich es auch klingt, dies kann tatsächlich funktionieren, wenn Sie eine intelligente Methode zum Zuordnen von Variablen zu Features finden.
Eine andere Möglichkeit ist die Darstellung von 2D-Projektionen des 3D-Phasendiagramms. Angenommen, Sie haben x1, x2, x3, x4 Ihre Variablen. Zeichnen Sie für jeden Wert von x4 ein 3D-Diagramm mit (x1, x2, x3) Punkten und verbinden Sie die Punkte. Dies funktioniert am besten, wenn x4 bestellt wird, z. B. Datum oder Uhrzeit.
UPDATE: Sie können auch Bubble-Plots ausprobieren. Drei Dimensionen wären das übliche kartesische x, y, z, und die vierte Dimension wäre die Größe des Blasenpunktes.
Sie können die Animation ausprobieren, dh die Zeit als vierte Dimension verwenden.
Auch eine Kombination aus Blase und Animation: x, y, Blase und Zeit.
Mit Chernoff ist auch ein Glyphen-Plot verbunden , der etwas ernster aussehen kann. Es sind Sterne mit einer Strahlenlänge proportional zu variablen Werten.
quelle