Wczytywanie danych ze źródeł zewnętrznych
Importowanie z pliku CSV
import pandas as pd
df = pd.read_csv('plik.csv', header = None, names = ['A','B','C], na_values = '-1', parse_dates=[[1,2,3]])
Parametry:
- header - indeks wskazujący numer wiersza z którego mają zostać pobrane nazwy kolumn, w przypadku podania wartości _None _kolumny są kolejno numerowane od 0, Parametr header może też przyjmować listę numerów indeksów i wówczas nazwa kolumny będzie brana z wiersza o zadanym indeksie.
- names - lista nazwa kolumn, jakie chcemy nadać dla obiektu
- na_values - _wskazanie wartości, która ma zostać zamieniona na wartość NaN. Jako parametr możemy podać również słownik mapujący nazwę kolumny na wartość reprezentującą wartość pustą: na_values = {'A': ['-1]}
- parse_dates - parametr pozwalający na rozpoznananie daty, np.: jeśli zawiera listę indeksów, wówczas wartości w kolumnach reprezentowanych przez te indeksy są traktowane tak, jakby w każdej kolumnie znajdowała się data, jeśli zawiera listę list indeksów, wówczas zakładane jest, że w każdej kolumnie reprezentowanej przez indeks znajduje się odpowiedni fragment daty.