Als «dataframe» getaggte Fragen

142
Bestimmen Sie die Anzahl der NA-Werte in einer Spalte

Ich möchte die Anzahl der NAWerte in einer Datenrahmenspalte zählen. Angenommen, mein Datenrahmen wird aufgerufen df, und der Name der Spalte, die ich in Betracht ziehe, lautet col. Ich habe mir Folgendes ausgedacht: sapply(df$col, function(x) sum(length(which(is.na(x))))) Ist dies ein guter /...

141
Benennen Sie den Pandas DataFrame-Index um

Ich habe eine CSV-Datei ohne Header mit einem DateTime-Index. Ich möchte den Index und den Spaltennamen umbenennen, aber mit df.rename () wird nur der Spaltenname umbenannt. Fehler? Ich bin auf Version 0.12.0 In [2]: df = pd.read_csv(r'D:\Data\DataTimeSeries_csv//seriesSM.csv', header=None,...

134
Pandas eindeutige Werte mehrere Spalten

df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) Was ist der beste Weg, um die eindeutigen Werte von 'Col1' und 'Col2' zurückzugeben? Die gewünschte Ausgabe ist 'Bob', 'Joe', 'Bill', 'Mary',...

129
R - Zwei Datenrahmen verketten?

Gegeben zwei Datenrahmen aund b: > a a b c 1 -0.2246894 -1.48167912 -1.65099363 2 0.5559320 -0.87898575 -0.15634590 3 1.8469466 -0.01487524 -0.53098215 4 -0.6875051 0.23880967 0.01824621 5 -0.6735163 0.75485292 0.44154092 > b a c 1 0.4287284 -0.3295925 2 0.5201492 0.3341251 3 -2.6355570...

129
Lassen Sie Zeilen weg, die eine bestimmte Spalte von NA enthalten

Ich möchte wissen, wie man NAWerte in einem Datenrahmen weglässt, aber nur in einigen Spalten, die mich interessieren. Beispielsweise, DF <- data.frame(x = c(1, 2, 3), y = c(0, 10, NA), z=c(NA, 33, 22)) aber ich möchte nur die Daten weglassen, wo yist NA, deshalb sollte das Ergebnis sein x y z 1...

129
Verketten Sie eine Liste von Pandas-Datenrahmen

Ich habe eine Liste von Pandas-Datenrahmen, die ich zu einem Pandas-Datenrahmen kombinieren möchte. Ich benutze Python 2.7.10 und Pandas 0.16.2 Ich habe die Liste der Datenrahmen erstellt aus: import pandas as pd dfs = [] sqlall = "select * from mytable" for chunk in pd.read_sql_query(sqlall ,...