Gibt es ein Tool zum Aufräumen von Daten für Python / Pandas, das dem Tool R tidyr ähnelt?

18

Ich arbeite an einer Kaggle-Herausforderung, bei der einige Variablen durch Zeilen anstelle von Spalten dargestellt werden (Telstra Network Disruption). Ich bin derzeit auf der Suche nach dem Äquivalent von gather (), separate () und spread (), die in R Tidyr Tool gefunden werden können.

cpumar
quelle

Antworten:

3

R gather()geht im Wesentlichen von weit nach lang. So,

  1. Überprüfen Sie die Pandas-Seite für die Verwendung pandas.wide_to_long(),
  2. In diesem Bloggather erfahren Sie , wie Sie eine elegante Funktion in Python erhalten.
ximiki
quelle
0

Ich habe versucht, das tidyr-Paket in Python in einem Paket namens tidypython syntaktisch nachzuahmen. Ich habe es mit dem Paket dplython kompatibel gemacht, das die Verwendung des Operators >> zum Verketten von Befehlen enthält.

Es wurde noch nicht vollständig getestet, sollte aber recht gut funktionieren:

https://github.com/durrantmm/tidypython

Lassen Sie mich wissen, ob es bei Ihnen funktioniert.

Matt Durrant
quelle