Ich bin neu in Python und Pandas. Ich versuche, eine tsv
Datei in einen Pandas zu laden DataFrame
.
Dies ist, was ich versuche und der Fehler, den ich bekomme:
>>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t'))
Traceback (most recent call last):
File "<pyshell#28>", line 1, in <module>
df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t'))
File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 318, in __init__
raise PandasError('DataFrame constructor not properly called!')
PandasError: DataFrame constructor not properly called!
read_csv('path_to_file', sep='\t')
. Siehe diese Antwort untenAntworten:
Hinweis : Ab 17.0
from_csv
wird davon abgeraten: Verwenden Siepd.read_csv
stattdessenIn der Dokumentation ist eine .from_csv- Funktion aufgeführt, die anscheinend das tut, was Sie wollen:
Wenn Sie einen Header haben, können Sie übergeben
header=0
.quelle
from_csv
davon abgeraten wird: Verwenden Siepd.read_csv
stattdessen!pd.read_csv/read_table
, Sie müssen nurdelim_whitespace=True
odersep
Ab 17.0
from_csv
wird davon abgeraten.Verwenden Sie
pd.read_csv(fpath, sep='\t')
oderpd.read_table(fpath)
.quelle
Verwenden Sie
read_table(filepath)
. Das Standardtrennzeichen ist tabquelle
Versuche dies
Sie müssen tatsächlich den sep- Parameter korrigieren .
quelle
Datei öffnen, als CSV speichern und dann anwenden
Ändern Sie für jedes andere Format einfach das sep-Tag
quelle
Sie können die tsv-Datei direkt in den Pandas-Datenrahmen laden, indem Sie Trennzeichen und Header angeben.
quelle