Integracja PS IMAGO PRO i R. Praktyczny przykład z użyciem diagramu Venna

Tekst przeczytasz w:  5 minut

Analiza danych to nie tylko wyliczanie podstawowych statystyk, ale przede wszystkim eksploracja i interpretacja wyników analiz, które pomagają podejmować trafne decyzje biznesowe.

 

PS IMAGO PRO od lat cieszy się uznaniem jako narzędzie umożliwiające sprawną analizę danych dzięki intuicyjnemu interfejsowi oraz bogatym funkcjom statystycznym. Z kolei język R, z jego ogromną liczbą pakietów zawierającymi zaawansowane funkcjonalności w zakresie analizy, otwiera przed analitykami zupełnie nowe możliwości – od niestandardowych wizualizacji aż po złożone modele uczenia maszynowego.

Integracja tego rozwiązania z R to doskonały sposób na połączenie najlepszych cech obu narzędzi. Dzięki tej współpracy można korzystać z przyjaznego interfejsu w formie okien dialogowych w PS IMAGO PRO do przygotowania i raportowania danych, jednocześnie wykorzystując możliwości analityczne R do tworzenia zaawansowanych modeli oraz estetycznych i zaawansowanych wizualizacji. To rozwiązanie sprawia, że praca analityka staje się bardziej efektywna, a wyniki – bardziej precyzyjne i atrakcyjne dla odbiorców. 

Jak używać języka R w PS IMAGO PRO?

W wersjach wcześniejszych niż PS IMAGO PRO 8 integracja z językiem R wymagała instalacji dodatkowej wtyczki „IBM SPSS Statistics – Essentials for R”. Użytkownicy musieli pobrać i zainstalować wtyczkę za pośrednictwem Centrum rozszerzeń, upewniając się przy tym o zgodności z odpowiednią wersją R. 

Od wersji PS IMAGO PRO 8 (IBM SPSS Statistics 28), wewnętrzne środowisko programistyczne R w wersji 4.0 oraz „IBM SPSS Statistics – Integration Plug-in for R” są integralnymi składnikami oprogramowania. Dzięki temu analityk może korzystać z intuicyjnego interfejsu PS IMAGO PRO, jednocześnie rozszerzając możliwości o te dostępne w języku R bez dodatkowego instalowania wtyczek i rozszerzeń.

Polecenia języka R należy umieścić w blokach BEGIN PROGRAM R – END PROGRAM, które wpisujemy w edytorze komend (Syntax Editor) w IBM SPSS Statistics. To narzędzie umożliwiające tworzenie, edycję oraz uruchamianie poleceń i skryptów, dzięki czemu można łączyć standardowe funkcje z zaawansowanymi możliwościami R.

Pobieranie danych z PS IMAGO PRO do R

Integracja PS IMAGO PRO z R umożliwia płynną wymianę danych między tymi dwoma środowiskami, co stanowi fundament efektywnej analizy. Jedną z podstawowych funkcji, które warto znać, jest możliwość pobrania danych z otwartego zbioru do np. ramki danych, którą następnie możemy dowolnie wykorzystać za pomocą R. W tym celu należy użyć funkcji spssdata.GetDataFromSPSS. To pozwala na korzystanie z szerokiej gamy narzędzi dostępnych w R do dalszych analiz i transformacji, wykorzystując dane pobrane z aktywnego zbioru danych.

Przykład:

 

BEGIN PROGRAM R.
# Pobranie danych z aktywnego zbioru danych
dane <- spssdata.GetDataFromSPSS()
# Wyświetlenie pierwszych kilku wierszy pobranych danych
head(dane)
END PROGRAM.

Zaawansowane wizualizacje. Więcej możliwości PS IMAGO PRO

PS IMAGO PRO to wszechstronne narzędzie do analizy danych, zawierające wiele niestandardowych wizualizacji. Korzystając z możliwości języka R mamy do dyspozycji dodatkowe typy wykresów. Jednym z przykładów takiej wizualizacji jest diagram Venna, który pozwala na graficzne przedstawienie relacji między zbiorami. Przydaje się szczególnie w analizie marketingowej, badaniach ankietowych czy eksploracji danych, gdy chcemy zobrazować, jak wiele elementów jest wspólnych dla różnych grup.

Załóżmy, że w zbiorze danych w PS IMAGO PRO mamy informacje dotyczące sprzedaży produktów z trzech kanałów: sklepy stacjonarne, strona internetowa i platformy marketplace (Allegro, Amazon). Chcemy sprawdzić, ilu klientów korzystało z jednego, dwóch lub wszystkich trzech kanałów sprzedaży. Dzięki R możemy pobrać te dane bezpośrednio ze zbioru PS IMAGO PRO i wygenerować diagram Venna.

Na początek warto zobaczyć, jak zorganizowane są dane w zbiorze danych w PS IMAGO PRO. Dla każdego z kanału sprzedaży mamy przygotowaną zmienną, która jest kodowana dychotomicznie: 1 – korzystał, 0 – nie korzystał. Dodatkowo mamy również zmienną z identyfikatorem klienta.

 

Rysunek 1.

Fragment danych, na podstawie których zostanie przygotowany diagram Venna

 

Przejdźmy teraz do kodu, który należy wprowadzić w oknie Syntax Editor w PS IMAGO PRO.

 

BEGIN PROGRAM R.
library(VennDiagram)
library(grid)
library(dplyr)

# Pobranie danych z aktywnego zbioru PS IMAGO PRO
dane <- spssdata.GetDataFromSPSS()

# Tworzenie zbiorów klientów dla każdej kategorii
set_A <- dane$id_klienta[dane$sklep == 1]  # Klienci, którzy kupowali w sklepie stacjonarnym
set_B <- dane$id_klienta[dane$strona == 1]  # Klienci, którzy kupowali na stronie internetowej
set_C <- dane$id_klienta[dane$marketplace == 1]  # Klienci, którzy kupowali w marketplace

# Tworzenie diagramu Venna dla trzech kategorii
venn.plot <- venn.diagram(
  x = list("Sklep stacjonarny" = set_A, "Strona internetowa" = set_B, "Platformy marketplace" = set_C),
  filename = NULL,    # Diagram nie jest zapisywany do pliku, lecz wyświetlany w PS IMAGO PRO, dlatego wartość NULL
  fill = c("#999999", "#E69F00", "#56B4E9"),
  alpha = 0.3,
  lty = "blank",
  cat.fontface = "bold",
  main = "Diagram Venna: Klienci a kanały sprzedaży",
  main.cex = 2
)# Wyświetlenie diagramu w PS IMAGO PRO
grid.draw(venn.plot)
END PROGRAM.

 

W rezultacie działania wprowadzonego kodu (jeśli mamy zainstalowane potrzebne biblioteki), otrzymujemy w oknie wyników diagram Venna dla trzech kategorii. Możemy zauważyć, że klientów korzystających tylko ze sklepów stacjonarnych było 10. Tych, którzy kupowali tylko na stronie internetowej, było 13. Z kolei tylko jedna osoba dokonała zakupu w obu tych miejscach. Pozostałe wyniki interpretujemy podobnie, jak wskazano powyżej. 

 

Rysunek 2.

Rezultatem działania przygotowanego kodu jest diagram Venna, który jest zapisany do okna wyników PS IMAGO PRO

Jak działa ten kod?

Jak widać, sam kod potrzebny do przygotowania diagramu nie jest bardzo skomplikowany i rozległy. Warto natomiast jeszcze omówić jego poszczególne fragmenty, aby lepiej zrozumieć jego działanie. 

  • Pobieranie bibliotek potrzebnych do wygenerowania wykresu (library())
    Na początku skryptu ładowane są kluczowe biblioteki, które umożliwiają generowanie wykresu. Warto pamiętać, że nie zawsze od razu będziemy mieć zainstalowane potrzebne pakiety. Trzeba wtedy sprawdzić, które są dostępne i ewentualne brakujące biblioteki należy doinstalować.
  • Pobieranie danych ze zbioru danych PS IMAGO PRO
    Funkcja spssdata.GetDataFromSPSS(), tak jak wspomniano wcześniej, pobiera dane z aktywnego zbioru PS IMAGO PRO. 
  • Tworzenie zbiorów do diagramu Venna
    set_A, set_B i set_C to listy klientów, którzy kupili odpowiednio w sklepie stacjonarnym, na stronie internetowej lub platformie marketplace.
  • Generowanie diagramu Venna
    Tutaj przechodzimy do głównej części, która decyduje o wygenerowaniu wykresu. Funkcja venn.diagram() tworzy wykres na podstawie utworzonych zbiorów. Dodatkowo użytkownik może zarządzać wyglądem i stalowaniem diagramu. Są to parametry dodatkowe, ale warto im chwilę poświęcić, aby nasz diagram był atrakcyjny wizualnie. Poniżej kilka parametrów wykorzystanych do przygotowania diagramu.
    • fill = c(„#999999”, „#E69F00”, „#56B4E9”) – określa kolory wypełnienia poszczególnych obszarów diagramu. W tym przypadku są to trzy kolory podane jako kody heksadecymalne, przypisane kolejno do trzech zestawów.
    • alpha = 0.3 – ustawia poziom przezroczystości wypełnienia. Wartość 0.3 oznacza, że kolory będą częściowo przeźroczyste (30% nieprzezroczystości), co pozwala bardziej widoczne nakładanie się obszarów.
    • lty = „blank” – określa typ linii krawędzi koło. Wartość „blank” powoduje, że linie nie są rysowane, czyli nie ma obrysów wokół kół.
    • cat.fontface = „bold” – ustawia styl czcionki etykiet kategorii. „Bold” oznacza, że etykiety będą pogrubione, co wyróżnia je na wykresie.
  • Wyświetlenie wykresu w SPSS
    grid.draw(venn.plot) renderuje diagram i pokazuje go w oknie wyników PS IMAGO PRO. 

Dzięki integracji PS IMAGO PRO z R można wzbogacić swoje analizy o zaawansowane wizualizacje, które ułatwiają interpretację danych i pozwalają na bardziej intuicyjne przedstawienie wyników. Diagram Venna to tylko jeden z przykładów, które oferuje R.

Integracja PS IMAGO PRO z językiem R

Integracja PS IMAGO PRO z językiem R poszerza możliwości analizy danych, łącząc wygodę interfejsu graficznego z zaawansowanymi funkcjami języka R. Dzięki temu użytkownicy mogą wykorzystywać zarówno intuicyjne narzędzia PS IMAGO PRO, jak i elastyczność środowiska R do przeprowadzania złożonych analiz, budowania niestandardowych modeli statystycznych czy tworzenia zaawansowanych wizualizacji danych. 

Możliwość płynnego transferu danych między PS IMAGO PRO a R pozwala na elastyczne przetwarzanie informacji, które można wykorzystać zarówno do zaawansowanych transformacji danych, jak i do budowania skomplikowanych modeli predykcyjnych. Przykładem jest użycie diagramów Venna do analizy relacji między różnymi kanałami sprzedaży, co pozwala w prosty sposób wizualizować złożone zbiory danych i wspiera podejmowanie bardziej świadomych decyzji biznesowych.

Oprócz funkcji wizualizacyjnych R umożliwia implementację najnowszych technik statystycznych, metod eksploracji danych oraz algorytmów uczenia maszynowego, które wykraczają poza standardowe możliwości PS IMAGO PRO. Jako przykład można podać algorytm DBSCAN czy XGBoost. Dzięki takiemu połączeniu analitycy zyskują dostęp do narzędzi pozwalających na jeszcze głębsze zrozumienie danych i identyfikację ukrytych wzorców. 


Udostępnij artykuł w social mediach:


Ustawienia dostępności
Wysokość linii
Odległość między literami
Wyłącz animacje
Przewodnik czytania
Czytnik
Wyłącz obrazki
Skup się na zawartości
Większy kursor
Skróty klawiszowe