Als «dataframe» getaggte Fragen

84

Fügen Sie eine Spalte zwischen zwei Spalten in einem data.frame hinzu (fügen Sie sie ein)

Ich habe einen Datenrahmen mit den Spalten a, b und c. Ich möchte eine neue Spalte d zwischen b und c hinzufügen. Ich weiß, dass ich mit cbind am Ende einfach d hinzufügen könnte, aber wie kann ich es zwischen zwei Spalten einfügen ?

r dataframe insert

84

Benennen Sie mehrere Spalten nach Namen um

Jemand hätte das schon fragen sollen, aber ich konnte keine Antwort finden. Sagen wir, ich habe: x = data.frame(q=1,w=2,e=3, ...and many many columns...) Was ist der eleganteste Weg, um eine beliebige Teilmenge von Spalten, deren Position ich nicht unbedingt kenne, in andere beliebige Namen...

r dataframe rename r-faq

83

Neudefinition des Index in einem Pandas DataFrame-Objekt

Ich versuche, ein Pandas- DataFrameObjekt wie folgt neu zu indizieren. From: a b c 0 1 2 3 1 10 11 12 2 20 21 22 To : b c 1 2 3 10 11 12 20 21 22 Ich gehe wie unten gezeigt vor und erhalte die falsche Antwort. Irgendwelche Hinweise, wie das geht? >>> col = ['a','b','c'] >>> data...

python pandas dataframe

83

Wie lösche ich Spalten, die NUR NAs enthalten?

Ich habe einen data.frame, der einige Spalten mit allen NA-Werten enthält. Wie kann ich sie aus dem data.frame löschen? Kann ich die Funktion nutzen? na.omit(...) einige zusätzliche Argumente angeben?

r dataframe na

83

So führen Sie eine Serie und einen DataFrame zusammen

Wenn Sie hierher gekommen sind, um Informationen zum Zusammenführen von a DataFrameund Serieszum Index zu erhalten , lesen Sie bitte diese Antwort . Die ursprüngliche Absicht des OP bestand darin, zu fragen, wie Serienelemente als Spalten einem anderen DataFrame zugewiesen werden sollen ....

python pandas dataframe

82

Suchen Sie die eindeutigen Werte in einer Spalte und sortieren Sie sie

Ich habe einen Pandas-Datenrahmen. Ich möchte die eindeutigen Werte einer seiner Spalten in aufsteigender Reihenfolge drucken. So mache ich es: import pandas as pd df = pd.DataFrame({'A':[1,1,3,2,6,2,8]}) a = df['A'].unique() print a.sort() Das Problem ist, dass ich eine Nonefür die Ausgabe...

python pandas sorting dataframe unique

81

Python-Pandas Wie ordne ich Spalten im übergeordneten Datenrahmen Groupby-Operationsergebnisse zu?

Ich habe den folgenden Datenrahmen in IPython, wobei jede Zeile ein einzelner Bestand ist: In [261]: bdata Out[261]: <class 'pandas.core.frame.DataFrame'> Int64Index: 21210 entries, 0 to 21209 Data columns: BloombergTicker 21206 non-null values Company 21210 non-null values Country 21210...

python group-by dataframe pandas

81

So ersetzen Sie NA-Werte in einer Tabelle für ausgewählte Spalten

Es gibt viele Beiträge zum Ersetzen von NA-Werten. Mir ist bewusst, dass man NAs in der folgenden Tabelle / im folgenden Frame durch die folgenden ersetzen könnte: x[is.na(x)]<-0 Aber was ist, wenn ich es nur auf bestimmte Spalten beschränken möchte? Lassen Sie mich Ihnen ein Beispiel...

r replace dataframe data.table na

81

Konvertieren Sie einen Datenrahmen in eine data.table ohne Kopie

Ich habe einen großen Datenrahmen (in der Größenordnung von mehreren GB), den ich in einen konvertieren möchte data.table. Mit using as.data.tablewird eine Kopie des Datenrahmens erstellt. Dies bedeutet, dass der verfügbare Speicher mindestens doppelt so groß wie die Daten sein muss. Gibt es eine...

r dataframe reference data.table

80

Elegante Möglichkeit, fehlende Werte in einem data.frame zu melden

Hier ist ein kleiner Code, den ich geschrieben habe, um Variablen mit fehlenden Werten aus einem Datenrahmen zu melden. Ich versuche mir einen eleganteren Weg zu überlegen, der vielleicht einen data.frame zurückgibt, aber ich stecke fest: for (Var in names(airquality)) { missing <-...

r dataframe missing-data

80

Erstellen Sie einen data.frame, in dem eine Spalte eine Liste ist

Ich weiß, wie man eine Listenspalte hinzufügt: > df <- data.frame(a=1:3) > df$b <- list(1:1, 1:2, 1:3) > df a b 1 1 1 2 2 1, 2 3 3 1, 2, 3 Das funktioniert, aber nicht: > df <- data.frame(a=1:3, b=list(1:1, 1:2, 1:3)) Error in data.frame(1L, 1:2, 1:3, check.names = FALSE,...

r list dataframe

80

Ersetzen Sie ungültige Werte in Pandas DataFrame durch None

Gibt es eine Methode, durch die Werte Nonein Pandas in Python ersetzt werden können? Sie können df.replace('pre', 'post')einen Wert verwenden und durch einen anderen ersetzen. Dies ist jedoch nicht möglich, wenn Sie ihn durch einen Wert ersetzen möchten. NoneWenn Sie dies versuchen, erhalten Sie...

python pandas dataframe replace nan

80

Entfernen / kürzen Sie alle Zeichenfolgen eines Datenrahmens

Wenn ich die Werte eines Multitype-Datenrahmens in Python / Pandas bereinige, möchte ich die Zeichenfolgen kürzen. Ich mache es derzeit in zwei Anweisungen: import pandas as pd df = pd.DataFrame([[' a ', 10], [' c ', 5]]) df.replace('^\s+', '', regex=True, inplace=True) #front df.replace('\s+$',...

python regex pandas dataframe trim

80

Spark Dataframe unterscheiden Spalten mit doppeltem Namen

Wie ich in Spark Dataframe weiß, kann dieser für mehrere Spalten denselben Namen haben, wie im folgenden Datenrahmen-Snapshot gezeigt: [ Row(a=107831, f=SparseVector(5, {0: 0.0, 1: 0.0, 2: 0.0, 3: 0.0, 4: 0.0}), a=107831, f=SparseVector(5, {0: 0.0, 1: 0.0, 2: 0.0, 3: 0.0, 4: 0.0})), Row(a=107831,...

python apache-spark dataframe pyspark apache-spark-sql

79

Datenrahmen gruppieren und Summe UND Anzahl erhalten?

Ich habe einen Datenrahmen, der so aussieht: Company Name Organisation Name Amount 10118 Vifor Pharma UK Ltd Welsh Assoc for Gastro & Endo 2700.00 10119 Vifor Pharma UK Ltd Welsh IBD Specialist Group, 169.00 10120 Vifor Pharma UK Ltd West Midlands AHSN 1200.00 10121 Vifor Pharma UK Ltd...

python pandas dataframe group-by pandas-groupby

79

Liste in Pandas Dataframe-Spalte konvertieren

Ich muss meine Liste in einen einspaltigen Pandas-Datenrahmen konvertieren Aktuelle Liste (len = 3): ['Thanks You', 'Its fine no problem', 'Are you sure'] Erforderliche Pandas DF (Form = 3,): 0 Thank You 1 Its fine no problem 2 Are you sure Bitte beachten Sie, dass die Zahlen den Index in Required...

python list pandas dataframe

79

Undefinierte Spalten, die beim Untersetzen des Datenrahmens ausgewählt wurden

Ich habe einen Datenrahmen. str(data)Um mehr über meinen Datenrahmen zu erfahren, ist das Ergebnis wie folgt: > str(data) 'data.frame': 153 obs. of 6 variables: $ Ozone : int 41 36 12 18 NA 28 23 19 8 NA ... $ Solar.R: int 190 118 149 313 NA NA 299 99 19 194 ... $ Wind : num 7.4 8 12.6 11.5...

r dataframe subset

79

Funktion auf DataFrame-Index anwenden

Was ist der beste Weg, um eine Funktion auf den Index eines Pandas anzuwenden DataFrame? Derzeit verwende ich diesen ausführlichen Ansatz: pd.DataFrame({"Month": df.reset_index().Date.apply(foo)}) Wo Dateist der Name des Index und fooist der Name der Funktion, die ich anwende....

python pandas indexing dataframe

79

Es wird versucht, 2 Datenrahmen zusammenzuführen, aber ValueError wird abgerufen

Dies sind meine beiden Datenrahmen, die in zwei Variablen gespeichert sind: > print(df.head()) > club_name tr_jan tr_dec year 0 ADO Den Haag 1368 1422 2010 1 ADO Den Haag 1455 1477 2011 2 ADO Den Haag 1461 1443 2012 3 ADO Den Haag 1437 1383 2013 4 ADO Den Haag 1386 1422 2014 >...

python pandas dataframe

78

Drucken (auf Papier) eines gut formatierten Datenrahmens

Ich möchte schön formatierte Datenrahmen auf Papier drucken, idealerweise aus einem Skript heraus. (Ich versuche, Daten mit einem Instrument zu sammeln und sie automatisch mit einem R-Skript zu verarbeiten und zu drucken.) Im Moment kann ich einen Datenrahmen mit in eine Textdatei schreiben...

r dataframe formatting