Als «pandas» getaggte Fragen

92
Haben Pandas Iterrows Leistungsprobleme?

Ich habe eine sehr schlechte Leistung bei der Verwendung von Iterrows von Pandas festgestellt. Ist das etwas, was andere erleben? Ist es spezifisch für Iterrows und sollte diese Funktion für Daten einer bestimmten Größe vermieden werden (ich arbeite mit 2-3 Millionen Zeilen)? Diese Diskussion auf...

91
Großer, beständiger DataFrame bei Pandas

Ich erforsche die Umstellung auf Python und Pandas als langjähriger SAS-Benutzer. Als ich heute einige Tests durchführte, war ich überrascht, dass Python beim Versuch, pandas.read_csv()eine 128-MB-CSV-Datei zu erstellen, nicht genügend Speicherplatz hatte . Es hatte ungefähr 200.000 Zeilen und...

91
Die Gesamtzahl der Pandas ist unterschiedlich

Angenommen, ich habe ein Protokoll der Benutzeraktivität und möchte einen Bericht über die Gesamtdauer und die Anzahl der eindeutigen Benutzer pro Tag erstellen. import numpy as np import pandas as pd df = pd.DataFrame({'date': ['2013-04-01','2013-04-01','2013-04-01','2013-04-02', '2013-04-02'],...

90
Pandas Groupby Wertebereich

Gibt es in Pandas eine einfache Methode, um groupbyeine Reihe von Werteinkrementen aufzurufen ? Im folgenden Beispiel kann ich beispielsweise die Spalte Bmit einem 0.155Inkrement binieren und gruppieren, sodass beispielsweise die ersten paar Gruppen in der Spalte Bin Bereiche zwischen '0 - 0,155,...

90
Wie sortiere ich einen Pandas DataFrame nach Index?

Wenn es einen DataFrame wie den folgenden gibt: import pandas as pd df = pd.DataFrame([1, 1, 1, 1, 1], index=[100, 29, 234, 1, 150], columns=['A']) Wie kann ich diesen Datenrahmen nach Index sortieren, wobei jede Kombination aus Index und Spaltenwert intakt ist?

90
Spalte im Datenrahmen aus Liste hinzufügen

Ich habe einen Datenrahmen mit einigen Spalten wie dieser: A B C 0 4 5 6 7 7 6 5 Der mögliche Wertebereich in A liegt nur zwischen 0 und 7 . Außerdem habe ich eine Liste von 8 Elementen wie folgt: List=[2,5,6,8,12,16,26,32] //There are only 8 elements in this list Wenn das Element in Spalte A n...

90
Beispieldatensätze in Pandas

Bei Verwendung von R ist es praktisch, "Übungs" -Datensätze mit zu laden data(iris) oder data(mtcars) Gibt es etwas Ähnliches für Pandas? Ich weiß, dass ich mit jeder anderen Methode laden kann, nur neugierig, ob etwas eingebaut ist.