Als «pandas» getaggte Fragen

136
Pandas teilen die Listenspalte in mehrere Spalten auf

Ich habe einen Pandas DataFrame mit einer Spalte: import pandas as pd df = pd.DataFrame( data={ "teams": [ ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ] } ) print(df) Ausgabe: teams 0 [SF, NYG] 1 [SF, NYG] 2 [SF, NYG] 3 [SF, NYG] 4 [SF,...

135
Wie lade ich eine tsv-Datei in einen Pandas DataFrame?

Ich bin neu in Python und Pandas. Ich versuche, eine tsvDatei in einen Pandas zu laden DataFrame. Dies ist, was ich versuche und der Fehler, den ich bekomme: >>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) Traceback (most recent call last): File...

134
Pandas eindeutige Werte mehrere Spalten

df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) Was ist der beste Weg, um die eindeutigen Werte von 'Col1' und 'Col2' zurückzugeben? Die gewünschte Ausgabe ist 'Bob', 'Joe', 'Bill', 'Mary',...

134
ImportError: Kein Modul mit dem Namen dateutil.parser

Beim Importieren pandasin ein PythonProgramm wird folgende Fehlermeldung angezeigt monas-mbp:book mona$ sudo pip install python-dateutil Requirement already satisfied (use --upgrade to upgrade): python-dateutil in /System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python Cleaning...

133
So drucken Sie ein Groupby-Objekt

Ich möchte das Ergebnis der Gruppierung mit Pandas drucken. Ich habe einen Datenrahmen: import pandas as pd df = pd.DataFrame({'A': ['one', 'one', 'two', 'three', 'three', 'one'], 'B': range(6)}) print(df) A B 0 one 0 1 one 1 2 two 2 3 three 3 4 three 4 5 one 5 Beim Drucken nach Gruppierung...

131
Pandas konvertieren Datenrahmen in Array von Tupeln

Ich habe einige Daten mit Pandas manipuliert und möchte jetzt eine Stapelspeicherung in der Datenbank durchführen. Dies erfordert, dass ich den Datenrahmen in ein Array von Tupeln konvertiere, wobei jedes Tupel einer "Zeile" des Datenrahmens entspricht. Mein DataFrame sieht ungefähr so ​​aus: In...

131
Normalisieren Sie Daten in Pandas

Angenommen, ich habe einen Pandas-Datenrahmen df: Ich möchte den spaltenweisen Mittelwert eines Datenrahmens berechnen. Das ist einfach: df.apply(average) dann der spaltenweise Bereich max (col) - min (col). Das ist wieder einfach: df.apply(max) - df.apply(min) Nun möchte ich für jedes Element den...

130
So überprüfen Sie den D-Typ einer Spalte in Python-Pandas

Ich muss verschiedene Funktionen verwenden, um numerische Spalten und Zeichenfolgenspalten zu behandeln. Was ich jetzt mache, ist wirklich dumm: allc = list((agg.loc[:, (agg.dtypes==np.float64)|(agg.dtypes==np.int)]).columns) for y in allc: treat_numeric(agg[y]) allc = list((agg.loc[:,...

129
Überprüfen Sie, ob die Variable ein Datenrahmen ist

Wenn meine Funktion f mit einer Variablen aufgerufen wird, möchte ich überprüfen, ob var ein Pandas-Datenrahmen ist: def f(var): if var == pd.DataFrame(): print "do stuff" Ich denke, die Lösung könnte recht einfach sein, aber auch mit def f(var): if var.values != None: print "do...

129
Verketten Sie eine Liste von Pandas-Datenrahmen

Ich habe eine Liste von Pandas-Datenrahmen, die ich zu einem Pandas-Datenrahmen kombinieren möchte. Ich benutze Python 2.7.10 und Pandas 0.16.2 Ich habe die Liste der Datenrahmen erstellt aus: import pandas as pd dfs = [] sqlall = "select * from mytable" for chunk in pd.read_sql_query(sqlall ,...