Pivot

Operacja pivot pozwala na zmianę struktury obiektu DataFrame transformując strukturę tabeli.

Załóżmy, że mamy następującą strukturę:

Wykonanie kodu:

new_df = df.pivot(index = 'treatment', columns='gender', values ='response')

Spowoduje utworzenie obiektu DataFrame w którym indeks jest wyliczony na podstawie unikalnych wartości w kolumnie 'treatment', kolumny wynikają z unikalnych wartości w kolumnie 'gender', a wartości w komórkach są sumą wartości w kolumnie 'response':

W przypadku, jeśli w parametrze values podamy więcej niż jedną wartość, wówczas obiekt docelowy może wyglądać w następujący sposób:

Metoda pivot _wymaga istnienia unikalnej wartości kolumn, z punktu widzenia założonego klucza. W powyższym przypadku, dla każdej wartości _treatment _możemy wyznaczyć unikalną wartość dla kolumn _F _i _M, ale nie zawsze musi tak być i wówczas metoda pivot _nie zadziała. Wtedy możemy wykorzystać metodę pivot_table_.

Pivot_table

Pivot_table działa podobnie jak pivot, ale w przypadku wielokrotnych wartości dla kolumn dla zadanego indeksu wykorzystuje funkcje agregujące wartości, domyślnie średnią:

df.pivot_table(index = 'treatment', columns='gender', values ='response', aggfunc = 'count')

Dodają dodatkowy atrybut margins = True można uzyskać podsumowanie wartości w kolumnach.

results matching ""

    No results matching ""