Mache ich eine Protokolltransformation von Daten korrekt?

8

Ich mache eine explorative Datenanalyse für einige Daten und erhalte folgende Histogramme:

Geben Sie hier die Bildbeschreibung ein

Das sieht aus wie ein Kandidat für eine Protokolltransformation der Daten, daher führe ich den folgenden Python-Code aus, um die Daten zu transformieren:

df["abv"].apply(np.log).hist()
df["ibu"].apply(np.log).hist()
plt.show()

Und ich bekomme diese neue Darstellung der transformierten Histogramme:

Geben Sie hier die Bildbeschreibung ein

Stimmt es, dass eine Protokolltransformation in diesem Fall in Ordnung war, und wenn ja, wie lassen sich die Ergebnisse am besten interpretieren?

Jon
quelle
6
Versuchen Sie hist(logx=True)stattdessen anzurufen .
Emre

Antworten:

5

Ja, die Protokolltransformation scheint eine gute Lösung für eine bessere Interpretation zu sein. Die Überlappung zwischen diesen beiden Datensätzen ist sehr gering. Wenn Sie sich also das Diagramm ansehen, können Sie mit hoher Sicherheit sagen, dass sie sich erheblich voneinander unterscheiden.

Kamil Kaczmarek
quelle
1
Zwischen diesem und dem, was @Emre erwähnte, war ich auf dem richtigen Weg!
Jon