Wie kann ich eine DataFrame-Zeichenfolgenspalte (im Format TT / MM / JJJJ ) in Datumsangaben konvertieren?
283
Wie kann ich eine DataFrame-Zeichenfolgenspalte (im Format TT / MM / JJJJ ) in Datumsangaben konvertieren?
Der einfachste Weg ist zu verwenden to_datetime
:
df['col'] = pd.to_datetime(df['col'])
Es bietet auch ein dayfirst
Argument für die europäische Zeit (aber Vorsicht, dies ist nicht streng ).
Hier ist es in Aktion:
In [11]: pd.to_datetime(pd.Series(['05/23/2005']))
Out[11]:
0 2005-05-23 00:00:00
dtype: datetime64[ns]
Sie können ein bestimmtes Format übergeben :
In [12]: pd.to_datetime(pd.Series(['05/23/2005']), format="%m/%d/%Y")
Out[12]:
0 2005-05-23
dtype: datetime64[ns]
DatetimeIndex(df['col']).to_pydatetime()
sollten funktionieren.SettingWithCopyWarning
gibt genug MaterialWenn Ihre Datumsspalte eine Zeichenfolge im Format '2017-01-01' ist, können Sie sie mit pandas astype in datetime konvertieren.
df['date'] = df['date'].astype('datetime64[ns]')
oder verwenden Sie datetime64 [D], wenn Sie Tagesgenauigkeit und keine Nanosekunden wünschen
print(type(df_launath['date'].iloc[0]))
ergibt
<class 'pandas._libs.tslib.Timestamp'>
das gleiche wie bei Verwendung von pandas.to_datetimeSie können es mit anderen Formaten als '% Y-% m-% d' versuchen, aber zumindest funktioniert dies.
quelle
Sie können Folgendes verwenden, wenn Sie schwierige Formate angeben möchten:
Weitere Details
format
hier:quelle
Wenn Ihr Datum eine Mischung aus Formaten enthält, vergessen Sie nicht, diese festzulegen
infer_datetime_format=True
, um das Leben zu erleichterndf['date'] = pd.to_datetime(df['date'], infer_datetime_format=True)
Quelle: pd.to_datetime
oder wenn Sie einen maßgeschneiderten Ansatz wünschen:
quelle