Ich arbeite an einer Kaggle-Herausforderung, bei der einige Variablen durch Zeilen anstelle von Spalten dargestellt werden (Telstra Network Disruption). Ich bin derzeit auf der Suche nach dem Äquivalent von gather (), separate () und spread (), die in R Tidyr Tool gefunden werden können.
18
Antworten:
Ich würde mit der melt () - Funktion in Pandas beginnen. Ich habe einen Artikel darüber geschrieben:
https://www.ibm.com/developerworks/community/blogs/jfp/entry/Tidy_Data_In_Python?lang=de
quelle
R
gather()
geht im Wesentlichen von weit nach lang. So,pandas.wide_to_long()
,gather
erfahren Sie , wie Sie eine elegante Funktion in Python erhalten.quelle
Ich habe versucht, das tidyr-Paket in Python in einem Paket namens tidypython syntaktisch nachzuahmen. Ich habe es mit dem Paket dplython kompatibel gemacht, das die Verwendung des Operators >> zum Verketten von Befehlen enthält.
Es wurde noch nicht vollständig getestet, sollte aber recht gut funktionieren:
https://github.com/durrantmm/tidypython
Lassen Sie mich wissen, ob es bei Ihnen funktioniert.
quelle