Ich bin sehr neu in Bezug auf R und Statistiken im Allgemeinen, aber ich muss ein Streudiagramm erstellen, von dem ich denke, dass es über seine ursprünglichen Kapazitäten hinausgeht.
Ich habe ein paar Vektoren von Beobachtungen und möchte mit ihnen ein Streudiagramm erstellen, und jedes Paar fällt in eine von drei Kategorien. Ich möchte ein Streudiagramm erstellen, das jede Kategorie entweder nach Farbe oder nach Symbol trennt. Ich denke, das wäre besser, als drei verschiedene Streudiagramme zu erzeugen.
Ich habe ein weiteres Problem mit der Tatsache, dass es in jeder der Kategorien große Cluster an einem Punkt gibt, aber die Cluster in einer Gruppe größer sind als in den beiden anderen.
Kennt jemand einen guten Weg, dies zu tun? Pakete, die ich installieren und verwenden lernen sollte? Hat jemand etwas ähnliches gemacht?
Vielen Dank
Dies ist eines der klassischen Probleme für den 'Iris'-Datensatz. Dies ist ein Link zu einer Reihe von Plotprojekten, die auf diesem Datensatz mit R-Code basieren und die Sie möglicherweise an Ihr Problem anpassen können.
Hier ist ein Ansatz, der mit Base R anstelle eines Add-On-Pakets verwendet wird.
was diese Figur erzeugt:
Abhängig von Ihrem Plot können Sie nun mit Alpha / Transparenz-Levels experimentieren, um ein Überplotten usw. zu ermöglichen, aber ich würde zuerst von einem sehr einfachen Graphen aufbauen.
Während es viele Gründe gibt, an der Basis R festzuhalten, vereinfachen andere Pakete das Plotten. Die Trennung von Daten durch ein Unterscheidungsmerkmal ist eine der Stärken der Pakete ggplot2 und lattice . ggplot2 macht besonders optisch ansprechende Plots. Beide Pakete werden in der Antwort von @cbeleites gezeigt.
quelle
Oder mit ggplot2:
Welches produziert
quelle