Podejścia do wyboru zmiennych niezależnych
W przypadku regresji wielowymiarowej stoimy przed decyzją, które z cech powinny znaleźć się jako zmienne niezależne w modelu, a które nie. Jest kilka podejść, które pozwolą nam na wybranie tych zmiennych wśród zbioru wszystkich cech:
All-in
Bierzemy wszystkie dostępne cechy. Nie jest to dobre podejście, ale czasami taką decyzję należy podjąć. Powody dla których takie podejście jest stosowane, to:
- wiedza, że kiedyś takie podejście zadziałało
- decyzja z zewnętrz, że należy wykorzystać wszystkie zmienne (np.: ze względu na procedury lub istniejące reguły)
- pierwszy krok do metody "backword elimination"