Ich mache eine explorative Datenanalyse für einige Daten und erhalte folgende Histogramme:
Das sieht aus wie ein Kandidat für eine Protokolltransformation der Daten, daher führe ich den folgenden Python-Code aus, um die Daten zu transformieren:
df["abv"].apply(np.log).hist()
df["ibu"].apply(np.log).hist()
plt.show()
Und ich bekomme diese neue Darstellung der transformierten Histogramme:
Stimmt es, dass eine Protokolltransformation in diesem Fall in Ordnung war, und wenn ja, wie lassen sich die Ergebnisse am besten interpretieren?
python
statistics
pandas
Jon
quelle
quelle
hist(logx=True)
stattdessen anzurufen .Antworten:
Ja, die Protokolltransformation scheint eine gute Lösung für eine bessere Interpretation zu sein. Die Überlappung zwischen diesen beiden Datensätzen ist sehr gering. Wenn Sie sich also das Diagramm ansehen, können Sie mit hoher Sicherheit sagen, dass sie sich erheblich voneinander unterscheiden.
quelle