Als «pandas» getaggte Fragen

159
Laden Sie Daten von txt mit Pandas

Ich lade eine txt-Datei, die eine Mischung aus Float- und String-Daten enthält. Ich möchte sie in einem Array speichern, in dem ich auf jedes Element zugreifen kann. Jetzt mache ich es einfach import pandas as pd data = pd.read_csv('output_list.txt', header = None) print data Dies ist die...

157
Löschen Sie alle doppelten Zeilen in Python Pandas

Die pandas drop_duplicatesFunktion eignet sich hervorragend zum "Eindeutigen" eines Datenrahmens. Eines der zu übergebenden Schlüsselwortargumente ist jedoch take_last=Trueoder take_last=False, während ich alle Zeilen löschen möchte, die Duplikate in einer Teilmenge von Spalten sind. Ist das...

157
Fortschrittsanzeige während Pandas-Operationen

Ich führe regelmäßig Pandas-Operationen an Datenrahmen mit mehr als 15 Millionen Zeilen durch und würde gerne Zugriff auf eine Fortschrittsanzeige für bestimmte Operationen haben. Gibt es eine textbasierte Fortschrittsanzeige für Pandas Split-Apply-Combine-Operationen? Zum Beispiel in so etwas...

154
Finden Sie den Index des Elements in der Pandas-Serie

Ich weiß, dass dies eine sehr grundlegende Frage ist, aber aus irgendeinem Grund kann ich keine Antwort finden. Wie kann ich den Index eines bestimmten Elements einer Serie in Python-Pandas abrufen? (erstes Auftreten würde ausreichen) Dh ich hätte gerne etwas wie: import pandas as pd myseries =...

151
Pandas erhalten Spaltenmittelwert / Mittelwert mit rundem Wert

Ich kann den Durchschnitt oder Mittelwert einer Spalte in Pandas nicht ermitteln. A haben einen Datenrahmen. Keines der Dinge, die ich unten ausprobiert habe, gibt mir den Durchschnitt der Spalteweight >>> allDF ID birthyear weight 0 619040 1962 0.1231231 1 600161 1963 0.981742 2 25602033...

150
Können Pandas Daten automatisch erkennen?

Heute war ich positiv überrascht, dass Pandas beim Lesen von Daten aus einer Datendatei (zum Beispiel) Wertetypen erkennen kann: df = pandas.read_csv('test.dat', delimiter=r"\s+", names=['col1','col2','col3']) Zum Beispiel kann es folgendermaßen überprüft werden: for i, r in df.iterrows(): print...

147
Pandas Prozentsatz der Gesamtzahl mit groupby

Das ist natürlich einfach, aber als numpy Neuling stecke ich fest. Ich habe eine CSV-Datei, die 3 Spalten enthält, den Status, die Büro-ID und den Vertrieb für dieses Büro. Ich möchte den Prozentsatz des Umsatzes pro Büro in einem bestimmten Bundesstaat berechnen (die Summe aller Prozentsätze in...