Nowości Predictive Solutions
Zmienione okna dla procedur Predictive Solutions
Dla wszystkich 66 procedur, w tym 5 nowych, w menu Predictive Solutions zostały przygotowane nowe okna dialogowe. Zmiana ta daje szereg nowych możliwości pracy z danymi, m.in. pozwala na:
- sortowanie zmiennych w porządku alfabetycznym, malejąco, rosnąco lub według przypisanego poziomu pomiaru,
- szybkie przełączanie się między nazwami a etykietami zmiennych,
- selekcję zmiennych ze względu na poziom pomiaru,
- możliwość zaznaczania z interfejsu okna wszystkich zmiennych dostępnych w danej procedurze,
- wskazanie, które pola procedury są wymagane.
Nowe okno dialogowe.
Nowe typy wizualizacji wyników
- WYKRES SKALI – specjalny typ wykresu dla zestawu cech mierzonych na tej samej skali. Tego typu wizualizacji możemy użyć jeśli chcemy na jednym wykresie zaprezentować zestaw cech, które mają biegunowe wartości np. „tak” i „nie” lub gdy skala jest znacznie bardziej rozbudowana np. od „całkowicie się zgadzam” do „całkowicie się nie zgadzam”. Może być wykorzystywany zarówno dla skal nieparzystych z pozycją centralną (neutralną) jak i skal parzystych. Ten typ wizualizacji przydaje się do obrazowania danych pochodzących ze np. skal Likerta, dyferencjału semantycznego, Stapela.
Wykres skali – zadowolenie z aspektów życia w mieście.
- MAPA KORELACJI – to wizualizacja, która służy do zaprezentowania na jednym wykresie zależności pomiędzy wieloma parami cech. Ułatwia analizę relacji dużej liczby zmiennych. Siła związku pomiędzy parami cech jest prezentowana przy użyciu nasycenia koloru lub gradientu czerwony-zielony. Dla ułatwienia interpretacji na wykresie można użyć etykiet: wartości współczynnika korelacji, liczebności zmiennej lub poziomu istotności. Procedura pozwala na prezentację jednej z czterech miar korelacji, tj. r Pearsona, r kwadrat, tau-b Kendalla lub rho Spearmana. Użytkownik ma możliwość wskazania wartości progowej poziomu istotności, co pozwali w łatwy sposób odfiltrować nieistotne statystycznie związki pomiędzy parami zmiennych.
Mapa korelacji – związki pomiędzy cechami samochodów.
Użyteczne procedury przygotowania danych
- PODZIEL NA PLIKI – procedura, która pozwoli na podzielenie zbioru danych na wiele podzbiorów bez mozolnej selekcji podgrup danych i zapisywania każdej podgrupy osobno. Jeśli chcemy np. rozdzielić dane na regiony, wystarczy wskazać cechę „region”, uruchomić procedurę i dostaniemy we wskazanej lokalizacji nowe pliki danych. Każdy z nich będzie reprezentował dane z jednego regionu, zapisane w postaci pliku .sav. Procedura pozwala na elastyczne zarządzanie nazwami tworzonych plików w oparciu o etykiety nazw i wartości lub preferencje użytkownika.
- PODZIEL TEKST – funkcjonalność umożliwia podzielenie jednej zmiennej tekstowej na wiele nowych zmiennych. Opcja szczególnie przydatna, gdy zmienna może w jednym rekordzie zawierać więcej niż jedną wartość, np. listę ostatnio zakupionych produktów oddzielonych przecinkami. Dzielenie zmiennej tekstowej może zostać wykonane na dwa sposoby. Pierwszy z nich to podział według wskazanego znaku bądź według wprowadzonego przez użytkownika własnego ciągu tekstowego. Druga opcja pozwala na podział zmiennej według stałej szerokości. Procedura utworzy nowe zmienne z nazwami składającymi się z podanego przez użytkownika prefiksu oraz licznika.
Wynik zastosowania procedury PODZIEL TEKST.
- ZLICZ CIĄGI – funkcja jest przydatna do analizy odpowiedzi respondentów z pytań otwartych lub innych tekstów w celu zidentyfikowania częstości występowania słów, całych fraz lub konkretnych zestawów znaków. Użyteczna jeśli przykładowo chcielibyśmy sprawdzić, czy w opisie zadowolenia z pobytu w hotelu pojawiają się takie pojęcia „pokój”, „łazienka”, „apartament” itp. oraz jak często. Korzystając z opcji, można wybrać zarówno możliwość sprawdzenia wystąpienia danego ciągu z określonej listy, jak również sprawdzić częstość pojawiania się danego ciągu. Użytkownik może określić czy brać pod uwagę wielkość znaków w ciągu.
Wynik zastosowania procedury ZLICZ CIĄGI.
Nowości w IBM SPSS Statistics 29.0.2
Ogólne ulepszenia
- EDYTOR DANYCH – funkcjonalność „Przegląd” dostępna w menu aplikacji, dostarcza podstawowych informacji o zmiennych w zbiorze danych. Obejmuje typy zmiennych, ich poziomy pomiaru czy braki danych. Umożliwia także dostęp do szczegółowych informacji dla poszczególnych zmiennych w formie wykresów i statystyk podsumowujących, w zależności od zdefiniowanego poziomu pomiaru zmiennych.
Nowe procedury analityczne
- MODELE PARAMETRYCZNEGO EFEKTU FRAILTY – to procedura budowy modeli parametrycznych ze współdzieloną słabością dostępna w menu Analizy przeżycia. Modele te są stosowane do analizy danych dotyczących czasu przeżycia, zwłaszcza w przypadku zdarzeń powtarzających się. Zakładają one znany rozkład czasu przeżycia, przy uwzględnieniu wprowadzonego czynnika słabości (frailty), który odzwierciedla dodatkową zmienność wynikającą z czynników indywidualnych lub grupowych. Umożliwiają one uwzględnienie tych nieobserwowanych efektów, co może poprawić trafność analizy.
- CENTYLE – to nowa procedura w menu Opis statystyczny pozwalająca na wyliczenie dowolnych percentyli przy użyciu jednej z pięciu dostępnych metod ich estymacji. Opcje te dostępne są również pod przyciskiem Statystyki w procedurze Eksploracja.
Ulepszenia dla poszczególnych procedur
- NOWE OPCJE W PROCEDURZE REGRESJA LINIOWA
- KRYTERIA WYBORU w oknie Statystyki – pozwalają na otrzymanie w podsumowaniu: kryterium informacyjne Akaike (aic), kryterium predykcyjne Ameniya (pc), kryterium Mallowsa (cp) i bayesowskie kryterium informacyjne Schwarza (sbc).
- TOLERANCJA w oknie Opcje – test tolerancji pozwala ocenić, czy dane zmienne spełniają minimalne wymagania, aby zostać uwzględnionymi w równaniu regresji, biorąc pod uwagę ich niezależność od innych zmiennych.
- Reszty PRESS (Predicted Residual Sum of Squares) w oknie Statystyki – pozwalają na ocenę jakości dopasowania modelu regresji.
- INDEKS YOUDENA DLA KRZYWYCH ROC – pozwala na ocenę klasyfikacji każdego punktu cięcia krzywej ROC, uwzględniając czułość i specyficzność.
- EKSPORT EBLUP – daje możliwość wyeksportowania zawartości tabel wynikowych EBLUP (Empirical Best Linear Unbiased Predictions) do zbioru danych lub pliku .sav w procedurach dot. modeli mieszanych (Analiza > Modele mieszane > Liniowy lub Uogólniony liniowy).
- REGRESJA COXA – przeprojektowane okno tej procedury analizy przeżycia, umożliwia teraz specyfikację i obliczenia wielu współzmiennych zależnych od czasu dla modeli regresji Coxa.