Dane przechowywane w obiekcie DataFrame indeksowanym datą można uszczegóławiać lub agregować. Angielski termin na tę czynność to resampling.

Resampling realizuje metoda resample, której jednym z atrybutów jest dokładność docelowego indeksu:

Resampling w kontekście agregacji danych, czyli zmniejszenia ich dokładności (downsampling) musi być wykonywany przy wykorzystaniu funkcji agregującej, która zlicza dane szczegółowe. Może to być suma, średnia, zliczenie rekordów, itp.

Typowa struktura wywołania wygląda następująco:

df.resample('W').mean()

I oznacza, że po wykonaniu polecenia w docelowej strukturze danych będziemy mieli dane z rozdzielcznością tygodniową, które zostały wyliczone w oparciu o średnią danych źrodłowych.

Kody wskazujące dokładności indeksu można poprzedzać wartościami numerycznymi, np.: "2W" oznacza rozdzielczość dwutygodniową.

Upsampling, czyli zwiększenie rozdzielczości danych (np.: z dziennych na godzinne) wymaga użycia metody wskazującej w jaki sposób mają być wyliczone wartości kolumn dla dotychczas nieistniejących indeksów. Można tu użyć np.: metod ffill _lub bfill_.

df.resample('4H').ffill()

results matching ""

    No results matching ""