Wizualizacja danych
Na obiekcie Data Frame można wywołać metodę plot, która wykorzystuje funkcjonalności z biblioteki matplotlib.pyplot, np.:
g1800s.plot(kind='scatter', x='1800', y='1899')
Spowoduje to narysowanie wykresu punktowego, gdzie na osi x będą odwzorowane dane z kolumny o nazwie '1800', a na osi y odpowiadające im dane z kolumny o nazwie '1899'.
Dla wykresów typu 'scatter' możliwe jest podanie dodatkowe parametru s, który zawiera wartości definiujące wielkość każdego z punktów.
Dane z obiektu DataFrame można również przenosić na wykresy operując na obiektach Series, które reprezentują pojedyncze kolumny z obiektu DataFrame:
import matplotlib.pyplot as plt
close_series = df['column']
plt.plot(close_series)
plt.show()
Jeszcze wygodniej jest wykorzystać metodę plot dostępną na obiekcie Series:
close_series.plot()
plt.show()
Zmiana parametrów wizualizacyjnych
Metoda plot _przyjmuje atrybut style_, który pozwala na zmianę wyglądu wykresu.
df['Column'].plot(style = 'k.-')
Tworzenie osobnych wykresów dla zestawu danych
Wykorzystanie parametru subplots=True pozwala na utworzenie osobnych wykresów dla każdej zadanej kolumny. Jest to szczególnie przydatne wówczas, kiedy skale wartości dla poszczególnych zestawów danych różnią się od siebie,
cols = ['weight', 'mpg']
# Generate the box plots
df[cols].plot(kind='box',subplots=True)
# Display the plot
plt.show()
Definiowanie osobnych sekcji dla wykresów możliwe jest również poprzez wywołane metody subplots.
fig, axes = plt.subplots(nrows=2, ncols=1)
Powyższy przykład tworzy nam dwie sekcje jako wiersze położone w jednej kolumnie.
Następnie definiując parametry każdego wykresu w parametrze ax wskazujemy, w której zdefiniowanej wcześniej sekcji dany wykres ma się pojawić:
df.fraction.plot(ax=axes[0], kind='hist', normed=True,bins=30, range=(0,.3))
plt.show()
# Plot the CDF
df.fraction.plot(ax=axes[1], kind='hist', normed=True, cumulative=True, bins=30, range=(0,.3))
plt.show()