Optymalizacja w zakresie dostępnych węzłów:
- Rozwiązano problem związany z dezaktualizacją modeli wynikającej ze zmian w danych źródłowych.
PS CLEMENTINE PRO oferuje teraz funkcję ciągłego zautomatyzowanego uczenia maszynowego, która pomaga w skutecznym niwelowaniu skutków dryftu modelu. Ciągłe uczenie maszynowe jest inspirowane biologicznym zjawiskiem naturalnej selekcji. Nowa funkcja jest dostępna do wykorzystania w węzłach Auto Klasyfikacja i Auto Predykcja.
Rysunek 1. Ustawienia modelu dla funkcji ciągłe zautomatyzowane uczenie maszynowe.
- Do węzła GLE na karcie Opcje budowania dodano nowe ustawienie Użyj metody najmniejszych kwadratów z ograniczeniem nieujemności.
Metoda najmniejszych kwadratów z ograniczeniem nieujemności (NNLS) to ograniczony problem najmniejszych kwadratów, w którym współczynniki nie mogą przyjmować wartości ujemnych. Nie wszystkie zbiory danych są odpowiednie do estymacji NNLS, ponieważ wymaga ona, aby między predyktorami a zmienną przewidywaną istniała korelacja dodatnia lub nie istniała żadna korelacja.
- Do węzła danych źródłowych Excel dodano nowe ustawienie Wiersze do przeskanowania dla kolumny i typu.
Pole liczbowe tej opcji oznacza ilość skanowanych wierszy w celu ustalenia typ kolumny i formatu składowania danych. Wartością domyślną jest 200.
Nowe platformy i środowiska współpracujące
- Wsparcie dla platforma Linux RedHat w wersji 8.3.
- Współpraca z nowszą wersją programu analitycznego R (4.0.4).
Rozszerzona lista obsługiwanych baz danych i innych mechanizmów
- Baza danych Db2 11.5.
- Baza danych Db2 Warehouse.
- Baza danych Db2 Big SQL 7.1.0 na platformie Cloudera Data Platform 7.1.5.
- Magazyn danych Apache Hive 3.1.3 na platformie Cloudera Data Platform 7.1.5.
- Mechanizm przetwarzania równoległego Cloudera Impala 3.4.0 na platformie Cloudera Data Platform 7.1.5.
- Baza danych Informix 14.10.