Als «pandas» getaggte Fragen

75
So wählen Sie die letzte Spalte des Datenrahmens aus

Ich habe nach der Antwort auf diese Frage gesucht, aber alles, was ich herausfinden kann, ist Folgendes: df[df.columns[len(df.columns)-1]] was mir unweildy und unpythonisch (und langsam?) erscheint. Was ist der einfachste Weg, um die Daten für die letzte Spalte in einem Pandas-Datenrahmen...

74
Pandas DataFrame-Leistung

Pandas ist wirklich großartig, aber ich bin wirklich überrascht, wie ineffizient es ist, Werte von einem Pandas.DataFrame abzurufen. Im folgenden Spielzeugbeispiel ist sogar die DataFrame.iloc-Methode mehr als 100-mal langsamer als ein Wörterbuch. Die Frage: Ist die Lektion hier nur, dass...

74
Pandas: Ändern Sie den Datentyp der Serie in String

Ich benutze Pandas 'Version 0.12.0' mit Python 2.7 und habe einen Datenrahmen wie folgt: df = pd.DataFrame({'id' : [123,512,'zhub1', 12354.3, 129, 753, 295, 610], 'colour': ['black', 'white','white','white', 'black', 'black', 'white', 'white'], 'shape': ['round', 'triangular',

74
Zusammenführen von Datenrahmen im Index mit Pandas

Ich habe zwei Datenrahmen und jeder hat zwei Indexspalten. Ich möchte sie zusammenführen. Der erste Datenrahmen ist beispielsweise der folgende: V1 A 1/1/2012 12 2/1/2012 14 B 1/1/2012 15 2/1/2012 8 C 1/1/2012 17 2/1/2012 9 Der zweite Datenrahmen ist der folgende: V2 A 1/1/2012 15 3/1/2012 21 B...

73
Python Pandas zählen und summieren bestimmte Bedingungen

Gibt es in Pandas einzelne Funktionen, um die Äquivalente von SUMIF auszuführen , die über eine bestimmte Bedingung summieren , und COUNTIF , das Werte bestimmter Bedingungen aus Excel zählt? Ich weiß, dass es viele Mehrschrittfunktionen gibt, für die verwendet werden kann zum Beispiel für...

73
Pandas Datenrahmen Gesamtzeile

Ich habe einen Datenrahmen, so etwas wie: foo bar qux 0 a 1 3.14 1 b 3 2.72 2 c 2 1.62 3 d 9 1.41 4 e 3 0.58 und ich möchte am Ende des Datenrahmens eine 'Gesamt'-Zeile hinzufügen: foo bar qux 0 a 1 3.14 1 b 3 2.72 2 c 2 1.62 3 d 9 1.41 4 e 3 0.58 5 tot 15 9.47 Ich habe versucht, den...

73
Pandas Datenrahmen read_csv bei fehlerhaften Daten

Ich möchte eine sehr große CSV-Datei einlesen (kann nicht einfach in Excel geöffnet und bearbeitet werden), aber irgendwo in der 100.000sten Zeile gibt es eine Zeile mit einer zusätzlichen Spalte, die zum Absturz des Programms führt. Diese Zeile ist fehlerhaft, daher muss ich die Tatsache...

72
Löschen Sie mehrere Spalten in Pandas

Ich versuche, mehrere Spalten (Spalte 2 und 70 in meinem Datensatz, indiziert als 1 bzw. 69) nach Indexnummer in einem Pandas-Datenrahmen mit dem folgenden Code zu löschen: df.drop([df.columns[[1, 69]]], axis=1, inplace=True) Ich erhalte folgende Fehlermeldung: TypeError: unhashable type:...