Ich möchte alle Zeilen löschen, die NaN-Werte für eine Spalte enthalten. Nehmen wir an, ich habe einen Datensatz wie diesen:
Age Height Weight Gender
12 5'7 NaN M
NaN 5'8 160 M
32 5'5 165 NaN
21 NaN 155 F
55 5'10 170 NaN
Ich möchte alle Zeilen entfernen, in denen 'Geschlecht' NaN-Werte hat. Die Ausgabe möchte ich:
Age Height Weight Gender
12 5'7 NaN M
NaN 5'8 160 M
21 NaN 155 F
Danke im Voraus!
machine-learning
python
data-cleaning
data
uharsha33
quelle
quelle
Antworten:
Nun, wenn der Datensatz nicht zu groß ist, würde ich vorschlagen, Pandas zu verwenden, um die Daten zu bereinigen. Sie müssten es also zuerst tun
Python2
Python3
Wenn Sie Anaconda bereits installiert haben, können Sie den obigen Schritt überspringen. Als nächstes können Sie eine IDE (wie jupyter) durchlaufen oder über die Shell die folgenden Befehle eingeben
Dann möchten Sie Ihr Ergebnis in einer Datei mit speichern
quelle
Wenn Sie an Python Dataframe arbeiten, versuchen Sie dies bitte.
Oder Sie können notnull anstelle von isfinite verwenden.
quelle