Ich habe einen Datenrahmen mit den Spalten a, b und c. Ich möchte eine neue Spalte d zwischen b und c hinzufügen. Ich weiß, dass ich mit cbind am Ende einfach d hinzufügen könnte, aber wie kann ich es zwischen zwei Spalten einfügen ?
Ich habe einen Datenrahmen mit den Spalten a, b und c. Ich möchte eine neue Spalte d zwischen b und c hinzufügen. Ich weiß, dass ich mit cbind am Ende einfach d hinzufügen könnte, aber wie kann ich es zwischen zwei Spalten einfügen ?
Jemand hätte das schon fragen sollen, aber ich konnte keine Antwort finden. Sagen wir, ich habe: x = data.frame(q=1,w=2,e=3, ...and many many columns...) Was ist der eleganteste Weg, um eine beliebige Teilmenge von Spalten, deren Position ich nicht unbedingt kenne, in andere beliebige Namen...
Ich versuche, ein Pandas- DataFrameObjekt wie folgt neu zu indizieren. From: a b c 0 1 2 3 1 10 11 12 2 20 21 22 To : b c 1 2 3 10 11 12 20 21 22 Ich gehe wie unten gezeigt vor und erhalte die falsche Antwort. Irgendwelche Hinweise, wie das geht? >>> col = ['a','b','c'] >>> data...
Ich habe einen data.frame, der einige Spalten mit allen NA-Werten enthält. Wie kann ich sie aus dem data.frame löschen? Kann ich die Funktion nutzen? na.omit(...) einige zusätzliche Argumente angeben?
Wenn Sie hierher gekommen sind, um Informationen zum Zusammenführen von a DataFrameund Serieszum Index zu erhalten , lesen Sie bitte diese Antwort . Die ursprüngliche Absicht des OP bestand darin, zu fragen, wie Serienelemente als Spalten einem anderen DataFrame zugewiesen werden sollen ....
Ich habe einen Pandas-Datenrahmen. Ich möchte die eindeutigen Werte einer seiner Spalten in aufsteigender Reihenfolge drucken. So mache ich es: import pandas as pd df = pd.DataFrame({'A':[1,1,3,2,6,2,8]}) a = df['A'].unique() print a.sort() Das Problem ist, dass ich eine Nonefür die Ausgabe...
Ich habe den folgenden Datenrahmen in IPython, wobei jede Zeile ein einzelner Bestand ist: In [261]: bdata Out[261]: <class 'pandas.core.frame.DataFrame'> Int64Index: 21210 entries, 0 to 21209 Data columns: BloombergTicker 21206 non-null values Company 21210 non-null values Country 21210...
Es gibt viele Beiträge zum Ersetzen von NA-Werten. Mir ist bewusst, dass man NAs in der folgenden Tabelle / im folgenden Frame durch die folgenden ersetzen könnte: x[is.na(x)]<-0 Aber was ist, wenn ich es nur auf bestimmte Spalten beschränken möchte? Lassen Sie mich Ihnen ein Beispiel...
Ich habe einen großen Datenrahmen (in der Größenordnung von mehreren GB), den ich in einen konvertieren möchte data.table. Mit using as.data.tablewird eine Kopie des Datenrahmens erstellt. Dies bedeutet, dass der verfügbare Speicher mindestens doppelt so groß wie die Daten sein muss. Gibt es eine...
Hier ist ein kleiner Code, den ich geschrieben habe, um Variablen mit fehlenden Werten aus einem Datenrahmen zu melden. Ich versuche mir einen eleganteren Weg zu überlegen, der vielleicht einen data.frame zurückgibt, aber ich stecke fest: for (Var in names(airquality)) { missing <-...
Ich weiß, wie man eine Listenspalte hinzufügt: > df <- data.frame(a=1:3) > df$b <- list(1:1, 1:2, 1:3) > df a b 1 1 1 2 2 1, 2 3 3 1, 2, 3 Das funktioniert, aber nicht: > df <- data.frame(a=1:3, b=list(1:1, 1:2, 1:3)) Error in data.frame(1L, 1:2, 1:3, check.names = FALSE,...
Gibt es eine Methode, durch die Werte Nonein Pandas in Python ersetzt werden können? Sie können df.replace('pre', 'post')einen Wert verwenden und durch einen anderen ersetzen. Dies ist jedoch nicht möglich, wenn Sie ihn durch einen Wert ersetzen möchten. NoneWenn Sie dies versuchen, erhalten Sie...
Wenn ich die Werte eines Multitype-Datenrahmens in Python / Pandas bereinige, möchte ich die Zeichenfolgen kürzen. Ich mache es derzeit in zwei Anweisungen: import pandas as pd df = pd.DataFrame([[' a ', 10], [' c ', 5]]) df.replace('^\s+', '', regex=True, inplace=True) #front df.replace('\s+$',...
Wie ich in Spark Dataframe weiß, kann dieser für mehrere Spalten denselben Namen haben, wie im folgenden Datenrahmen-Snapshot gezeigt: [ Row(a=107831, f=SparseVector(5, {0: 0.0, 1: 0.0, 2: 0.0, 3: 0.0, 4: 0.0}), a=107831, f=SparseVector(5, {0: 0.0, 1: 0.0, 2: 0.0, 3: 0.0, 4: 0.0})), Row(a=107831,...
Ich habe einen Datenrahmen, der so aussieht: Company Name Organisation Name Amount 10118 Vifor Pharma UK Ltd Welsh Assoc for Gastro & Endo 2700.00 10119 Vifor Pharma UK Ltd Welsh IBD Specialist Group, 169.00 10120 Vifor Pharma UK Ltd West Midlands AHSN 1200.00 10121 Vifor Pharma UK Ltd...
Ich muss meine Liste in einen einspaltigen Pandas-Datenrahmen konvertieren Aktuelle Liste (len = 3): ['Thanks You', 'Its fine no problem', 'Are you sure'] Erforderliche Pandas DF (Form = 3,): 0 Thank You 1 Its fine no problem 2 Are you sure Bitte beachten Sie, dass die Zahlen den Index in Required...
Ich habe einen Datenrahmen. str(data)Um mehr über meinen Datenrahmen zu erfahren, ist das Ergebnis wie folgt: > str(data) 'data.frame': 153 obs. of 6 variables: $ Ozone : int 41 36 12 18 NA 28 23 19 8 NA ... $ Solar.R: int 190 118 149 313 NA NA 299 99 19 194 ... $ Wind : num 7.4 8 12.6 11.5...
Was ist der beste Weg, um eine Funktion auf den Index eines Pandas anzuwenden DataFrame? Derzeit verwende ich diesen ausführlichen Ansatz: pd.DataFrame({"Month": df.reset_index().Date.apply(foo)}) Wo Dateist der Name des Index und fooist der Name der Funktion, die ich anwende....
Dies sind meine beiden Datenrahmen, die in zwei Variablen gespeichert sind: > print(df.head()) > club_name tr_jan tr_dec year 0 ADO Den Haag 1368 1422 2010 1 ADO Den Haag 1455 1477 2011 2 ADO Den Haag 1461 1443 2012 3 ADO Den Haag 1437 1383 2013 4 ADO Den Haag 1386 1422 2014 >...
Ich möchte schön formatierte Datenrahmen auf Papier drucken, idealerweise aus einem Skript heraus. (Ich versuche, Daten mit einem Instrument zu sammeln und sie automatisch mit einem R-Skript zu verarbeiten und zu drucken.) Im Moment kann ich einen Datenrahmen mit in eine Textdatei schreiben...