Opis kursu
Kurs koncentruje się na zastosowaniu wielowymiarowych technik analizy danych. Statystyki opisowe pozwalają zrozumieć dane i wyciągnąć z nich użyteczne wnioski. Analitycy jednak często chcą pójść o krok dalej i budować modele przewidujące dane zjawisko z użyciem wielu zmiennych wyjaśniających. Jest wiele technik analitycznych, które można wykorzystać do tworzenia modeli predykcyjnych. Naukę ich wykorzystania zdecydowanie najlepiej zacząć od klasycznych technik regresyjnych takich jak regresja liniowa. Nadaje się ona do przewidywania zmiennych ilościowych takich jak: wielkość sprzedaży, cena samochodu używanego itp. Uczestnicy kursu pozyskają także wiedzę i praktyczne umiejętności wykorzystania technik klasyfikacji takich jak: regresja logistyczna, czy analiza dyskryminacyjna. Mogą one być wykorzystywane do klasyfikacji do grup typu: „kupi” – „nie kupi”, „spłaci kredyt” – „nie spłaci kredytu”.
Czas trwania
- Szkolenie trwa 24 godziny lekcyjne (3 dni po 8 godzin)
Program zajęć
- Wprowadzenie do analizy regresji liniowej – cel analizy i przykładowe obszary zastosowań,
- Analiza korelacji – przypomnienie podstawowych pojęć,
- Regresja liniowa dwóch zmiennych - wprowadzenie,
- Założenia regresji liniowej,
- Interpretacja wyników regresji liniowej,
- Regresja liniowa wielu zmiennych,
- Wprowadzanie zmiennych nominalnych do analizy regresji,
- Regresja logistyczna - wprowadzenie,
- Założenia regresji logistycznej,
- Interpretacja wyników regresji logistycznej,
- Ocena jakości modelu poprzez krzywe ROC,
- Analiza dyskryminacyjna – wprowadzenie,
- Założenia analizy dyskryminacyjnej i problemy z nimi związane,
- Interpretacja wyników analizy dyskryminacyjnej.
Szkolenia na zamówienie
Szkolenie może zostać zrealizowane także na indywidualnie zamówienie – zdalnie lub w siedzibie Klienta.
Jego program może zostać dostosowany do indywidualnych potrzeb.
Polecane kursy uzupełniające
Dla zainteresowanych zasadami wizualizacji wyników analiz i umiejętnością tworzenia własnych form wizualizacji: ST 2a. Wizualizacja informacji z użyciem raportów tabelarycznych i wykresów
Dla zainteresowanych analizą predykcyjną z użyciem sieci neuronowych i drzew decyzyjnych: ST 3a. Statystyczna analiza danych. Budowanie modeli predykcyjnych z użyciem technik maszynowego uczenia
Dla zainteresowanych predykcją opartą o klasyczne techniki regresji: DM 3a. Predykcja z wykorzystaniem technik regresji liniowej i regresji logistycznej
Dla zainteresowanych technikami prognozowania zjawisk w czasie: ST 3b . Statystyczna analiza danych. Analiza szeregów czasowych i prognozowanie
Dla zainteresowanych technikami wielowymiarowymi wykorzystywanymi do segmentacji i profilowania: MC 2a. Marketing i analityczny CRM. Segmentacja rynku i profilowanie klientów
Dla zainteresowanych automatyzacją zadań i zaawansowanymi przekształceniami na danych: OB 2. Praca z językiem poleceń, makrodefinicje, tryb wsadowy
Dla zainteresowanych wizualizacją i raportowaniem wyników analizy danych: OB 2a. PS IMAGO PRO / IBM SPSS Statistics. Praca z danymi, wizualizacje, tworzenie i publikowanie raportów.
Informacje dodatkowe
Profil uczestnika
Kurs adresowany do osób, które chcą lepiej poznać techniki statystyczne służące do modelowania predykcyjnego, aby efektywniej podejmować decyzje.
Wykorzystane oprogramowanie
PS IMAGO PRO / IBM SPSS Statistics
Umiejętności zdobywane podczas kursu
- Przygotowanie danych na potrzeby konkretnych technik analitycznych,
- Zapoznanie z procesem konstruowania modeli z wykorzystaniem takich technik, jak: regresja liniowa, regresja logistyczna, analiza dyskryminacyjna,
- Prawidłowe wnioskowanie na podstawie uzyskanych wyników,
- Umiejętność przewidywania wartości zmiennej zależnej na podstawie zestawu predyktorów,
- Ocena skuteczności modeli predykcyjnych.