Ich habe einen Datenrahmen mit kategorialen Daten:
colour direction
1 red up
2 blue up
3 green down
4 red left
5 red right
6 yellow down
7 blue down
Ich möchte einige Diagramme wie Kreisdiagramme und Histogramme basierend auf den Kategorien generieren. Ist es möglich, ohne numerische Dummy-Variablen zu erstellen? Etwas wie
df.plot(kind='hist')
df["colour"].value_counts().plot(kind='bar')
als übliche Alternativedf['colour'].value_counts()[['green', 'yellow', 'blue', 'red']]
Möglicherweise finden Sie nützliche
mosaic
Diagramme aus Statistikmodellen. Dies kann auch zu statistischen Hervorhebungen für die Abweichungen führen.Achten Sie jedoch auf die Zelle mit der Größe 0 - sie verursacht Probleme mit Etiketten.
Siehe diese Antwort für Details
quelle
so was :
quelle
Sie können auch
countplot
von verwendenseaborn
. Dieses Paket baut aufpandas
einer Plot-Oberfläche auf hoher Ebene auf. Sie erhalten kostenlos ein gutes Styling und korrekte Achsenbeschriftungen.Es unterstützt auch das Färben der Balken in der richtigen Farbe mit einem kleinen Trick
quelle
Um mehrere kategoriale Features als Balkendiagramme auf demselben Plot darzustellen, würde ich Folgendes vorschlagen:
quelle