Ich versuche, eine CSV-Datei mit pandas.read_csv()
zu importieren, möchte jedoch nicht die zweite Zeile der Datendatei importieren (die Zeile mit dem Index = 1 für die 0-Indizierung).
Ich kann nicht sehen, wie ich es nicht importieren soll, da die mit dem Befehl verwendeten Argumente nicht eindeutig sind:
Von der Pandas-Website:
skiprows
: list-like oder integerZu überspringende Zeilennummern (0-indiziert) oder Anzahl der zu überspringenden Zeilen (int) am Anfang der Datei. "
Wenn ich skiprows=1
die Argumente eingebe, woher weiß es, ob die erste Zeile oder die Zeile mit Index 1 übersprungen werden soll?
Antworten:
Sie können es selbst versuchen:
quelle
[]
.from io import StringIO
pd.compat.StringIO
.Ich habe noch keinen Ruf zu kommentieren, aber ich möchte die Antwort von alko als weitere Referenz hinzufügen .
Aus den Dokumenten :
quelle
Ich habe das gleiche Problem beim Ausführen der Skiprows beim Lesen der CSV-Datei. Ich habe skip_rows = 1 gespendet, das wird nicht funktionieren
Ein einfaches Beispiel gibt eine Vorstellung davon, wie beim Lesen von CSV-Dateien Skiprows verwendet werden.
quelle
Bei all diesen Antworten fehlt ein wichtiger Punkt: Die n-te Zeile ist die n-te Zeile in der Datei und nicht die n-te Zeile im Datensatz. Ich habe eine Situation, in der ich einige veraltete Daten zur Stromstärke von der USGS herunterlade. Der Kopf des Datensatzes wird mit '#' kommentiert, die erste Zeile danach sind die Beschriftungen, als nächstes folgt eine Zeile, die die Datumstypen beschreibt, und zuletzt die Daten selbst. Ich weiß nie, wie viele Kommentarzeilen es gibt, aber ich weiß, was die ersten paar Zeilen sind. Beispiel:
Es wäre schön, wenn es eine Möglichkeit gäbe, die n-te Zeile sowie die n-te Zeile automatisch zu überspringen.
Als Hinweis konnte ich mein Problem beheben mit:
quelle
skip[1]
überspringt die zweite Zeile, nicht die erste.quelle
Stellen Sie außerdem sicher, dass Ihre Datei tatsächlich eine CSV-Datei ist.Wenn Sie beispielsweise eine XLS-Datei hatten und einfach die Dateierweiterung in CSV geändert haben, wird die Datei nicht importiert und gibt den obigen Fehler aus. Um zu überprüfen, ob dies Ihr Problem ist, öffnen Sie die Datei in Excel und es wird wahrscheinlich Folgendes angezeigt:
"Das Dateiformat und die Erweiterung von 'Filename.csv' stimmen nicht überein. Die Datei könnte beschädigt oder unsicher sein. Wenn Sie ihrer Quelle nicht vertrauen, öffnen Sie sie nicht. Möchten Sie sie trotzdem öffnen?"
So beheben Sie die Datei: Öffnen Sie die Datei in Excel, klicken Sie auf "Speichern unter", wählen Sie das zu speichernde Dateiformat aus (verwenden Sie .cvs) und ersetzen Sie die vorhandene Datei.
Dies war mein Problem und hat den Fehler für mich behoben.
quelle