Opis kursu
Celem kursu jest wprowadzenie uczestników do modelowania predykcyjnego przy użyciu oprogramowania PS CLEMETINE PRO/ IBM SPSS Modeler. Podczas pracy z narzędziami analitycznymi zdarza się, że za bardzo skupiamy się na kwestiach technicznych związanych z budową modelu. W efekcie za mało czasu poświęcamy na analizę współzależności dostępnych zmiennych i zrozumienie używanych predyktorów. Otrzymujemy model, który mimo tego, że technicznie działa poprawnie, nie ma sensu merytorycznego, czy biznesowego. Dlatego pokażemy metody poszukiwania współzależności między zmiennymi oraz funkcjonalności redukujące zbyt dużą liczbę predyktorów. Dobre zrozumienie zależności pomiędzy zmiennymi jest ważne nie tylko w kontekście budowy zaawansowanych modeli analitycznych, ale pozwala także na ewaluację już funkcjonujących reguł eksperckich lub budowę nowych. W ramach szkolenia poznamy też zaawansowane algorytmy indukcji reguł asocjacyjnych i ich wykorzystanie w modelach regułowych. Uporządkujemy również wiedzę dotyczącą technik predykcyjnych oraz ich doboru do budowy modeli dla zmiennych o różnej skali pomiaru. W trakcie szkolenia nauczymy nie tylko porównywać modele, ale także tworzyć predykcje na podstawie połączenia wiedzy z kilku modeli.
Czas trwania
- Szkolenie trwa 16 godzin lekcyjnych (2 dni po 8 godzin)
Program zajęć
- Badanie i wizualizacja zależności między zmiennymi (np. wykresy sieciowe),
- Metody wyboru najlepszych predyktorów do modelowania,
- Wdrażanie reguł eksperckich oraz weryfikacja ich poprawności,
- Wprowadzenie do reguł asocjacyjnych – elementy budowy i miary oceny jakości,
- Indukcja reguł asocjacyjnych na podstawie algorytmu Apriori i Carma,
- Wymiar czasu w regułach asocjacyjnych – model Sekwencji,
- Skala pomiaru zmiennej a wybór klasy modeli,
- Techniki automatycznej budowy modeli,
- Analiza wyników modelowania oraz porównanie modeli,
- Predykcja w oparciu o wiele modeli – metody łączenia wiedzy.
Szkolenia na zamówienie
Szkolenie może zostać zrealizowane także na indywidualnie zamówienie – zdalnie lub w siedzibie Klienta.
Jego program może zostać dostosowany do indywidualnych potrzeb.
Polecane kursy uzupełniające
Dla zainteresowanych poprawą jakości i wykrywania nieprawidłowości w danych do modelowania: DM 2. Zrozumienie, ocena jakości i przygotowanie danych do modelowania
Dla zainteresowanych predykcją opartą o klasyczne techniki regresji: DM 3a. Predykcja z wykorzystaniem technik regresji liniowej i regresji logistycznej
Dla zainteresowanych predykcją opartą o drzewa decyzyjne i sieci neuronowe: DM 3b. Predykcja z wykorzystaniem sieci neuronowych i drzew decyzyjnych
Dla zainteresowanych technikami wielowymiarowymi wykorzystywanymi do grupowania: DM 3c. Grupowanie z wykorzystaniem k-średnich, sieci Kohonena i dwustopniowego grupowania
Dla zainteresowanych technikami prognozowania zjawisk w czasie: DM 3d. Prognozowanie z wykorzystaniem analizy szeregów czasowych
Informacje dodatkowe
Profil uczestnika
Szkolenie kierowane jest do osób, które chcą eksplorować duże wolumeny danych i zrozumieć zachodzące w nich zależności używając w tym celu dedykowanych algorytmów, które automatyzują prace eksploracyjne oraz budowę modeli na dużych zbiorach.
Wykorzystane oprogramowanie
PS CLEMENTINE PRO / IBM SPSS Modeler
Umiejętności zdobywane podczas kursu
- Analiza i prezentacja współzależności między zmiennymi przy pomocy różnych technik,
- Automatyzacja doboru predyktorów podczas pracy z dużymi zbiorami danych,
- Poszukiwanie reguł asocjacyjnych z pomocą algorytmów Apriori, Carma i Sekwencji,
- Świadomy dobór technik modelowania danych do poziomu pomiaru zmiennej przewidywanej,
- Wybór wstępnych modeli w oparciu o wyniki i algorytmów automatycznej budowy modeli.