Wizualizacja danych

Na obiekcie Data Frame można wywołać metodę plot, która wykorzystuje funkcjonalności z biblioteki matplotlib.pyplot, np.:

g1800s.plot(kind='scatter', x='1800', y='1899')

Spowoduje to narysowanie wykresu punktowego, gdzie na osi x będą odwzorowane dane z kolumny o nazwie '1800', a na osi y odpowiadające im dane z kolumny o nazwie '1899'.

Dla wykresów typu 'scatter' możliwe jest podanie dodatkowe parametru s, który zawiera wartości definiujące wielkość każdego z punktów.

Dane z obiektu DataFrame można również przenosić na wykresy operując na obiektach Series, które reprezentują pojedyncze kolumny z obiektu DataFrame:

import matplotlib.pyplot as plt

close_series = df['column']

plt.plot(close_series)
plt.show()

Jeszcze wygodniej jest wykorzystać metodę plot dostępną na obiekcie Series:

close_series.plot()
plt.show()

Zmiana parametrów wizualizacyjnych

Metoda plot _przyjmuje atrybut style_, który pozwala na zmianę wyglądu wykresu.

df['Column'].plot(style = 'k.-')

Tworzenie osobnych wykresów dla zestawu danych

Wykorzystanie parametru subplots=True pozwala na utworzenie osobnych wykresów dla każdej zadanej kolumny. Jest to szczególnie przydatne wówczas, kiedy skale wartości dla poszczególnych zestawów danych różnią się od siebie,

cols = ['weight', 'mpg']

# Generate the box plots
df[cols].plot(kind='box',subplots=True)

# Display the plot
plt.show()

Definiowanie osobnych sekcji dla wykresów możliwe jest również poprzez wywołane metody subplots.

fig, axes = plt.subplots(nrows=2, ncols=1)

Powyższy przykład tworzy nam dwie sekcje jako wiersze położone w jednej kolumnie.

Następnie definiując parametry każdego wykresu w parametrze ax wskazujemy, w której zdefiniowanej wcześniej sekcji dany wykres ma się pojawić:

df.fraction.plot(ax=axes[0], kind='hist', normed=True,bins=30, range=(0,.3))
plt.show()

# Plot the CDF
df.fraction.plot(ax=axes[1], kind='hist', normed=True, cumulative=True, bins=30, range=(0,.3))
plt.show()

Wizualizacja danych