Als «pandas» getaggte Fragen

109
Python Pandas führen nur bestimmte Spalten zusammen

Ist es möglich, nur einige Spalten zusammenzuführen? Ich habe einen DataFrame df1 mit den Spalten x, y, z und df2 mit den Spalten x, a, b, c, d, e, f usw. Ich möchte die beiden DataFrames auf x zusammenführen, aber ich möchte nur die Spalten df2.a, df2.b zusammenführen - nicht den gesamten...

109
Teststrategien für Pandas read_xml () -Methoden

Derzeit pflegen Pandas I / O-Tools keine read_xml()Methode und das Gegenstück to_xml(). Es zeigt sich jedoch, read_jsondass baumartige Strukturen für den Datenrahmenimport und read_htmlfür Markup-Formate implementiert werden können . Wenn die Pandas Team einen solchen hält read_xmlfür eine...

109
Weisen Sie pandas dataframe column dtypes zu

Ich möchte das dtypes mehrerer Spalten festlegen pd.Dataframe(Ich habe eine Datei, die ich manuell in eine Liste von Listen analysieren musste, da die Datei nicht zugänglich war pd.read_csv). import pandas as pd print pd.DataFrame([['a','1'],['b','2']], dtype={'x':'object','y':'int'},...

107
kartesisches Produkt bei Pandas

Ich habe zwei Pandas-Datenrahmen: from pandas import DataFrame df1 = DataFrame({'col1':[1,2],'col2':[3,4]}) df2 = DataFrame({'col3':[5,6]}) Was ist die beste Vorgehensweise, um ihr kartesisches Produkt zu erhalten (natürlich ohne es explizit wie ich zu schreiben)? #df1, df2 cartesian product...

107
Holen Sie sich die Summe der Pandas-Spalten

Ziel Ich habe einen Pandas-Datenrahmen, wie unten gezeigt, mit mehreren Spalten und möchte die Gesamtsumme der Spalten erhalten MyColumn. Datenrahmen -df: print df X MyColumn Y Z 0 A 84 13.0 69.0 1 B 76 77.0 127.0 2 C 28 69.0 16.0 3 D 28 28.0 31.0 4 E 19 20.0 85.0 5 F 84 193.0 70.0 Mein Versuch :...

106
Ändern Sie einen Wert basierend auf einem anderen Wert in Pandas

Ich versuche, meinen Stata-Code für Geschwindigkeitsverbesserungen in Python umzuprogrammieren, und ich wurde in Richtung PANDAS gezeigt. Es fällt mir jedoch schwer, mich mit der Verarbeitung der Daten zu beschäftigen. Angenommen, ich möchte alle Werte in der Spaltenüberschrift 'ID' durchlaufen....