Was ist die Python-Methode zum Einlesen einer CSV-Datei in einen Pandas-DataFrame (den ich dann für statistische Operationen verwenden kann, der Spalten mit unterschiedlichen Typen usw. haben kann)?
Meine CSV-Datei "value.txt"
enthält folgenden Inhalt:
Date,"price","factor_1","factor_2"
2012-06-11,1600.20,1.255,1.548
2012-06-12,1610.02,1.258,1.554
2012-06-13,1618.07,1.249,1.552
2012-06-14,1624.40,1.253,1.556
2012-06-15,1626.15,1.258,1.552
2012-06-16,1626.15,1.263,1.558
2012-06-17,1626.15,1.264,1.572
In R würden wir diese Datei lesen mit:
price <- read.csv("value.txt")
und das würde einen R data.frame zurückgeben:
> price <- read.csv("value.txt")
> price
Date price factor_1 factor_2
1 2012-06-11 1600.20 1.255 1.548
2 2012-06-12 1610.02 1.258 1.554
3 2012-06-13 1618.07 1.249 1.552
4 2012-06-14 1624.40 1.253 1.556
5 2012-06-15 1626.15 1.258 1.552
6 2012-06-16 1626.15 1.263 1.558
7 2012-06-17 1626.15 1.264 1.572
Gibt es eine pythonische Möglichkeit, die gleiche Funktionalität zu erhalten?
Antworten:
Pandas zur Rettung:
Dies gibt Pandas DataFrame zurück , die ähnlich sind
R's
.quelle
Hier ist eine Alternative zur Pandas-Bibliothek mit dem in Python integrierten CSV-Modul .
wird gedruckt
quelle
Um eine CSV-Datei als Pandas DataFrame zu lesen, müssen Sie verwenden
pd.read_csv
.Aber hier endet die Geschichte nicht. Daten sind in vielen verschiedenen Formaten vorhanden und werden auf unterschiedliche Weise gespeichert. Daher müssen Sie häufig zusätzliche Parameter übergeben,
read_csv
um sicherzustellen, dass Ihre Daten ordnungsgemäß eingelesen werden.In der folgenden Tabelle sind gängige Szenarien für CSV-Dateien sowie das entsprechende Argument aufgeführt, das Sie verwenden müssen. Normalerweise benötigen Sie alle oder eine Kombination der folgenden Argumente, um Ihre Daten einzulesen .
Es gibt andere Argumente, die ich hier nicht erwähnt habe, aber diese werden Ihnen am häufigsten begegnen.
quelle
index_col
: Sagen Sie den Pandas, welche Spalte (n) als Index für Ihren Datenrahmen verwendet werden sollen'Dadurch wird Ihre TXT- oder CSV-Datei in einen DataFrame importiert.
quelle
Versuche dies
Ersetzen Sie den Dateizielspeicherort, an dem sich Ihr Datensatz befindet, unter dieser URL https://medium.com/@kanchanardj/jargon-in-python-used-in-data-science-to-laymans-language-part- one-12ddfd31592f
quelle
quelle
Sie können das CSV- Modul in der Python-Standardbibliothek verwenden, um CSV-Dateien zu bearbeiten.
Beispiel:
quelle
csv
Modul suchen, da es zu niedrig ist.pandas
bietet die angeforderte Abstraktionsebene.Beachten Sie ganz so sauber, aber:
Nicht so kompakt, aber es macht den Job:
quelle