Opis kursu
Przeznaczeniem kursu jest zaprezentowanie zaawansowanych technik modelowania dostępnych w bibliotece scikit-learn i w Apache Spark, a zaimplementowanych i zintegrowanych z IBM SPSS Modeler/PS CLEMENTINE PRO. Umiejętność łączenia funkcjonalności różnych środowisk analitycznych zwiększa elastyczność i efektywność pracy analityka. Wspomniane wyżej środowiska stanowią istotne rozszerzenie tradycyjnie wykorzystywanych metod, dlatego w trakcie szkolenia będziemy korzystać zarówno z klasycznych metod budowy modeli, jak i rozwijać je przy pomocy algorytmów zaimplementowanych w omawianych środowiskach. Uczestnicy poznają dzięki temu takie algorytmy jak: lasy losowe, drzewa XGBoost, SVM z jedną klasą, metoda k-średnich, mieszanina rozkładów Gaussa, HDBSCAN. Po szkoleniu uczestnicy będą wiedzieć, w jaki sposób używać węzłów modelowania opartych na środowiskach Python/Spark, a korzystanie z graficznego interfejsu umożliwi korzystanie z tych metod bez konieczności nauki języka Python. Efektem udziału w szkoleniu będzie zdobycie umiejętności doboru do celu analizy odpowiedniego algorytmu z palety Python/Spark oraz wskazania i oceny różnic w działaniu każdego z nich. Kurs będzie obejmował także wdrażanie modeli do procesów analitycznych oraz wprowadzenie do rozszerzonej parametryzacji algorytmów opierając się o integrację środowisk PS CLEMENTINE PRO i Python for Spark.