DM 2. Zrozumienie, ocena jakości i przygotowanie danych do modelowania

Szkolenie z linii DM (predykcyjne)

Opis kursu

Opis kursu

Ideą kursu jest przekazanie umiejętności zaawansowanej pracy z danymi tym analitykom, którzy chociaż raz musieli wyrzucić swoje modele predykcyjne, bo popełnili błąd na początku analizy. Na szkoleniu uczymy nie tyle, jak skrócić czas pracy z danymi, ale jak uczynić tę pracę bardziej skuteczną. Kurs jest więc adresowany do osób, którym zależy na „bezproblemowym” przejściu do modelowania po fazie przygotowania danych. Dane w analizach data mining i data science mają zwykle swoje źródło w systemach transakcyjnych, które podlegały wielu transformacjom i przekształceniom, na które analityk nie ma wpływu. Z drugiej strony, tworząc modele predykcyjne interesuje nas zrozumienie zachowań osób, których dane transakcyjne są tylko pewnym odzwierciedleniem. Z tego zderzenia potrzeb analityków a stanu danych faktycznie dostępnych, wynika szereg nietrywialnych zagadnień i problemów. Jak podejść do tych danych, aby zdecydować, czy będą one dla nas przydatne? Czy pozwolą nam lepiej zrozumieć modelowane zjawisko? Czy ich jakość jest wystarczająca, aby je uwzględniać w analizach? Jak to ocenić? Czy użycie wielowymiarowych metod imputacji może nam w tym pomóc? Jak na końcu przekształcić te dane w plik przydatnych danych analitycznych? Czy te zagadnienia są praktyczne? Przypuszczalnie każdy praktyk powie, że tak. Czy są fascynujące? Raczej nie, ale są krytycznie ważne, aby dobrze przejść projekt data mining.

Czas trwania

Czas trwania

  • Szkolenie trwa 16 godzin lekcyjnych (2 dni po 8 godzin)

Program zajęć

Program zajęć

  • Zrozumienie i przygotowanie danych – wprowadzenie,
  • Ocena znaczenia danych i ich dobór,
  • Wykorzystanie technik eksploracyjnej analizy danych w zrozumieniu danych,
  • Ocena jakości danych,
  • Sposoby podnoszenia jakości danych,
  • Przetwarzanie danych,
  • Przygotowanie danych do modelowania, kryteria dodatkowe,
  • Postprocessing.

Szkolenia na zamówienie

 Szkolenia na zamówienie

Szkolenie może zostać zrealizowane na indywidualnie zamówienie – zdalnie lub w siedzibie Klienta. Jego program może zostać dostosowany do indywidualnych potrzeb. 

Zapytaj

Kursy uzupełniające

Polecane kursy uzupełniające

Dla zainteresowanych eksploracją, poprawą jakości i wykrywaniem nieprawidłowości w danych do modelowania: DM 3. Eksploracja danych z wykorzystaniem indukcji reguł asocjacyjnych, automatycznej budowy modeli.

Dla zainteresowanych predykcją opartą o klasyczne techniki regresji: DM 3a. Predykcja z wykorzystaniem technik regresji liniowej i regresji logistycznej

Dla zainteresowanych predykcją opartą o drzewa decyzyjne i sieci neuronowe: DM 3b. Predykcja z wykorzystaniem sieci neuronowych i drzew decyzyjnych

Dla zainteresowanych technikami wielowymiarowymi wykorzystywanymi do grupowania: DM 3c. Grupowanie z wykorzystaniem k-średnich, sieci Kohonena i dwustopniowego grupowania

Dla zainteresowanych technikami prognozowania zjawisk w czasie: DM 3d. Prognozowanie z wykorzystaniem analizy szeregów czasowych

Dla zainteresowanych wykorzystaniem języka Python w PS CLEMENTINE PRO: OB 3b . PS CLEMENTINE PRO / IBM SPSS Modeler. Wykorzystanie języka Python.

Dla zainteresowanych wykorzystaniem języka R w PS CLEMENTINE PRO: OB 3c. PS CLEMENTINE PRO / IBM SPSS Modeler. Wykorzystanie języka R.

Dla zainteresowanych budową modeli klasyfikacyjnych typujących klientów do kampanii marketingowych: MC 2b. Analityczny wybór grup docelowych do kampanii marketingu bezpośredniego

Informacje dodatkowe

Informacje dodatkowe

 

profil uczestnika

 

wykorzystywane oprogramowanie

 

Umiejętności zdobywane podczas kursu

Profil uczestnika

Szkolenie jest przeznaczone dla praktyków, zajmujących się lub chcących się zajmować modelowaniem w ramach projektów data mining i data science, którzy uznają umiejętność odpowiedniego podejścia do danych za krytyczną.

Wykorzystywane oprogramowanie

PS CLEMENTINE PRO / IBM SPSS Modeler

Umiejętności zdobywane podczas kursu:

  • Wiedza na temat sposobów podejścia do oceny przydatności danych do modelowania,
  • Umiejętność oceny jakości danych i jej wpływu na budowane modele,
  • Wiedza z zakresu eksploracji danych i pułapek, jakie zwykle pojawiają się w danych,
  • Zapoznanie z praktycznymi sposobami podnoszenia jakości danych,
  • Przygotowanie danych poprzez przekształcanie dostępnych informacji.

Kontakt

Porozmawiajmy

o szkoleniu dopasowanym do Twoich potrzeb

Chętnie odpowiemy na twoje pytania, skontaktuj się z nami w sprawie oferty

Filip Krzystanek

Analityczne Rozwiązania Biznesowe

bankowość i finanse, ubezpieczenia, windykacja, e-commerce, agencje badawcze, usługi konsultingowe, media i reklama, IT, szkolenia

Filip Krzystanek

Menedżer

 +48 797 727 092

Ustawienia dostępności
Zwiększ wysokość linii
Zwiększ odległość między literami
Wyłącz animacje
Przewodnik czytania
Czytnik
Większy kursor