Pandas Resample Dokumentation

184

Ich verstehe also vollkommen, wie man Resample verwendet , aber die Dokumentation macht keine gute Arbeit darin, die Optionen zu erklären.

Die meisten Optionen in der resampleFunktion sind also ziemlich einfach, mit Ausnahme dieser beiden:

  • Regel: Die Offset-Zeichenfolge oder das Objekt, die die Zielkonvertierung darstellt
  • wie: Zeichenfolge, Methode zum Down- oder Re-Sampling, standardmäßig 'mean'

Wenn ich mir also so viele Beispiele ansehe, wie ich online gefunden habe, kann ich sehen, welche Regeln Sie 'D'für Tag, 'xMin'Minuten, 'xL'Millisekunden ausführen können, aber das ist alles, was ich finden konnte.

denn wie ich folgendes gesehen habe 'first', np.max, 'last', 'mean', und 'n1n2n3n4...nx'wo nx ist der erste Buchstabe eines jeden Spaltenindex.

Gibt es also irgendwo in der Dokumentation, die mir fehlt, die alle Optionen für pandas.resampledie Regel und wie Eingaben anzeigt ? Wenn ja, wo, weil ich es nicht finden konnte. Wenn nein, welche Möglichkeiten gibt es für sie?

Ryan Saxe
quelle
8
Für Google-Wanderer, zum Resampling mit how='last'und how='first': Vergessen Sie nicht, hinzuzufügen closed='left', label='left'. Link
Nasser Al-Wohaibi
@ NasserAl-Wohaibi Ich bin ziemlich sicher, dass Ihr Kommentar oben ein Hinweis darauf ist, dass diese Optionen dazu beitragen können, die folgende Frage vollständig zu beantworten. Haben Sie dieses Problem schon einmal festgestellt? stackoverflow.com/questions/26247301/…
Amelio Vazquez-Reina
how = 'last' ist jetzt zugunsten vonresample(...).last()
shadi

Antworten:

312
B         business day frequency
C         custom business day frequency (experimental)
D         calendar day frequency
W         weekly frequency
M         month end frequency
SM        semi-month end frequency (15th and end of month)
BM        business month end frequency
CBM       custom business month end frequency
MS        month start frequency
SMS       semi-month start frequency (1st and 15th)
BMS       business month start frequency
CBMS      custom business month start frequency
Q         quarter end frequency
BQ        business quarter endfrequency
QS        quarter start frequency
BQS       business quarter start frequency
A         year end frequency
BA, BY    business year end frequency
AS, YS    year start frequency
BAS, BYS  business year start frequency
BH        business hour frequency
H         hourly frequency
T, min    minutely frequency
S         secondly frequency
L, ms     milliseconds
U, us     microseconds
N         nanoseconds

Siehe die Dokumentation zur Zeitreihe . Es enthält eine Liste von Offsets (und "verankerten" Offsets ) sowie einen Abschnitt zum Resampling .

Beachten Sie, dass es keine Liste aller verschiedenen howOptionen gibt, da es sich um eine beliebige NumPy-Array-Funktion handeln kann und jede Funktion, die über Groupby Dispatching verfügbar ist, namentlich übergeben werden kann how.

Matti John
quelle
1
"... weil es jede NumPy-Array-Funktion sein kann und ..." - ja, das habe ich in den Dokumenten gelesen, aber gibt es irgendwo eine Dokumentation, die erklärt, was genau diese Funktion tun soll und was sie mit der zu tun hat Resampling ...? Ich fühle mich hier ziemlich verloren.
Jhin
1
Dies sollte in allen relevanten Dokumentationsbereichen wie Resample verknüpft werden. Hier ist der Link zu den Abkürzungen: pandas.pydata.org/pandas-docs/stable/…
wordsforthewise
Hinzugefügt , um eine Pull - Anforderung , die Dokumentation zu verbessern github.com/pandas-dev/pandas/pull/30252
Aseem Bansal
65

Es steckt noch mehr dahinter, aber Sie suchen wahrscheinlich nach dieser Liste:

B   business day frequency
C   custom business day frequency (experimental)
D   calendar day frequency
W   weekly frequency
M   month end frequency
BM  business month end frequency
MS  month start frequency
BMS business month start frequency
Q   quarter end frequency
BQ  business quarter endfrequency
QS  quarter start frequency
BQS business quarter start frequency
A   year end frequency
BA  business year end frequency
AS  year start frequency
BAS business year start frequency
H   hourly frequency
T   minutely frequency
S   secondly frequency
L   milliseconds
U   microseconds

Quelle: http://pandas.pydata.org/pandas-docs/stable/timeseries.html#offset-aliases

vonkohorn
quelle
8
Warum gibt es nicht das 'Min' (wie das in der Dokumentation verwendete '5Min')?
Ziyuang