Wenn Sie nur die ersten 999.999 Zeilen (ohne Header) lesen möchten:
read_csv(..., nrows=999999)
Wenn Sie nur Zeilen lesen möchten 1.000.000 ... 1.999.999
read_csv(..., skiprows=1000000, nrows=999999)
nrows : int, default None Anzahl der zu lesenden Dateizeilen. Nützlich zum Lesen großer Dateien *
skiprows : Listenähnliche oder ganzzahlige Zeilennummern, die übersprungen werden sollen (0-indiziert) oder Anzahl der zu überspringenden Zeilen (int) am Anfang der Datei
und für große Dateien möchten Sie wahrscheinlich auch Chunksize verwenden:
chunksize : int, default None Gibt das TextFileReader-Objekt zur Iteration zurück
pandas.io.parsers.read_csv Dokumentation
chunksize
ist ein bisschen schmerzhaft, man muss mit ungleich großen Stücken umgehen. Ordnen Sie auch Ihre Arrays / Datenrahmen mit der festen Größe vor, von der Sie wissen, dass Sie sie benötigen. Führen Sie Concat / Append nicht dynamisch durch, wenn Sie dies vermeiden können.nstart=,nend=...
. Sie müssen die Arithmetik amskiprows = nend - nrows
LIMIT nstart, skiprows
header=n/list