Pozycjonowanie marki względem konkurencji, odczytanie przypisanych jej cech i atrybutów jest często jednym z kluczowych wyzwań z jakimi muszą uporać się pracownicy marketingu, promocji czy też opiekunowie produktu. Zaakcentowanie przewag i kluczowych cech marki pozwala lepiej dopasować przekaz promocyjny do oczekiwań potencjalnych klientów. Z drugiej strony, świadomość mocnych stron konkurencji pozwala zaplanować własną strategię działania.
Pytanie o to, w jaki sposób klienci postrzegają marki od razu przywodzi na myśl mapy percepcyjne. To dość szeroki zestaw wizualizacji, które przygotowywane są przy pomocy takich technik jak opisywana w kilku wcześniejszych artykułach analiza korespondencji. Świetnie sprawdza się ona przy wykorzystaniu zmiennych jakościowych, ale dobrze radzi sobie także z mapami opartymi o średnie. W niniejszym tekście chciałbym zaprezentować czytelnikom kolejną technikę pozycjonowania w oparciu o mapy percepcyjne – skalowanie wielowymiarowe z wykorzystaniem algorytmu ALSCAL.
Dystans i macierz odległości
Skalowanie wielowymiarowe jako dane wsadowe wykorzystuje macierz odległości pomiędzy analizowanymi atrybutami lub obiektami. Warto podkreślić, że dystans interpretujemy odwrotnie niż korelacje (podstawa analizy czynnikowej) czy współwystępowanie. Im większa jest jego wartość (większa odległość) tym obiekty są mniej do siebie podobne.
Wykorzystanie macierzy odległości sprawia, że skalowanie wielowymiarowe i związane z nim kategorie pojęciowe bliższe są raczej analizie skupień niż wspomnianym technikom. Za pomocą skalowania wielowymiarowego można jednak dokonać wizualizacji wyników na mapie percepcyjnej, która może być przystępniejsza w odbiorze i łatwiejsza w interpretacji niż klasyczny dendrogram.
Odległość to w uproszczeniu różnica pomiędzy obiektami, obliczana na podstawie wykorzystanych w analizie zmiennych. Przykładowo, mając dwie osoby w różnym wieku, możemy obliczyć odległość pomiędzy nimi, jako prostą różnicę w ilości lat.
W przypadku dwóch zmiennych dystans można obliczyć według różnych formuł – najpopularniejszą z nich jest odległość euklidesowa. Obliczamy ją jako pierwiastek z sumy kwadratów różnic pomiędzy obiektami na poszczególnych wymiarach (zmiennych). Przyjrzyjmy się zamieszczonej poniżej ilustracji. Dystans pomiędzy obiektem A i B możemy wyrazić jako sumę kwadratów różnic na wymiarze X (w tym przypadku wynosi ona 16) oraz wymiarze Y (wynosi ona 36), zaś suma tych wartości (kwadratów różnic) to 52. Odległość między punktami to pierwiastek z 52. Jeżeli mamy więcej niż 2 zmienne lub wymiary, to odległość pomiędzy punktami obliczamy w analogiczny sposób – sumujemy kwadraty różnic na każdym z nich, a z uzyskanej sumy obliczamy pierwiastek kwadratowy.
Rysunek 1. Odległość pomiędzy punktami w przestrzeni dwuwymiarowej.
W skalowaniu wielowymiarowym taki sposób obliczania odległości jest właściwy dla zmiennych ilościowych. Odległość możemy obliczyć jednak również dla zmiennych porządkowych. W tym przypadku właściwszą miarą jest jednak tzw. odległość miejska. Wartości zmiennych porządkowych wyrażają rangi, za pomocą których możemy dokonać uporządkowania obiektów. Odległość to różnica pomiędzy rangami. Należy jednak pamiętać, że rangi nie mają charakteru zmiennych metrycznych, wobec czego wykorzystując wiele zmiennych nie możemy postępować z nimi tak, jak w przypadku zmiennych ilościowych. W przypadku rang sumujemy różnice pomiędzy pozycjami (wyrażone w wartościach bezwzględnych) na każdej z wykorzystywanych zmiennych – wymiarów. Ostateczny dystans to suma poszczególnych odległości. Gdyby zamieszczony powyżej rysunek przedstawiał różnice w rangach (np. pozycje zajęte podczas zawodów sportowych) to różnica pomiędzy obiektami A i B wynosiłaby 4 (różnica w konkurencji X) + 6 (różnica w konkurencji Y) = łącznie 10 pozycji w obydwu konkurencjach.
Warto pamiętać, że różnica pomiędzy poszczególnymi wartościami musi spełniać pewne kryteria, aby można ją było nazywać odległością. Są to [1]:
- dodatniość: odległość jest zawsze większa lub równa 0
- symetryczność: odległość A od B równa się odległości B od A
- zwrotność: odległość obiektu od samego siebie jest równa 0
- nierówność trójkąta: bezpośrednia odległość pomiędzy obiektami jest zawsze większa lub równa w porównaniu do odległości mierzonej za pośrednictwem trzeciego obiektu (dAB ≤ dAC + dBC).
Wykorzystywana przez algorytm skalowania wielowymiarowego macierz odległości, to zestawienie odległości pomiędzy wszystkimi parami obiektów. Na przekątnej takiej macierzy znajduje się 0 (czyli dystans jaki dzieli dany obiekt od niego samego). Należy ponownie podkreślić, że im większa wartość w macierzy, tym większa odległość dzieli poszczególne, porównywane obiekty.
Na szczęście algorytm skalowania wielowymiarowego posiada możliwość wykorzystania danych surowych i sam obliczy taką macierz, co jest bardzo wygodne na etapie eksploracji danych.
Pozycjonowanie marek z wykorzystaniem algorytmu ALSCAL
Zadaniem skalowania wielowymiarowego jest uproszczenie obrazu odległości pomiędzy analizowanymi obiektami. Zróżnicowanie/odległości zobrazowane za pomocą wielu zmiennych powinno zostać odwzorowane jak najlepiej na dwuwymiarowej mapie percepcyjnej. Obiekty podobne do siebie powinny znajdować się blisko siebie, natomiast obiekty oceniane odmiennie – daleko.
Rozważmy przykład. Pewna amerykańska firma produkująca sprzęt do obrony osobistej postanowiła przeprowadzić badania na temat postrzegania swoich produktów przez klientów. Respondenci oceniali w skali od 1 do 10 w jakim stopniu zaprezentowane im stwierdzenia pasują do poszczególnych urządzeń. Dodatkowo ocenianym obiektem był również ideał – hipotetyczny produkt posiadający najbardziej pożądany zestaw cech. Przed analizą oceny zostały przemnożone przez 100 aby uzyskać skalę procentową. Zamieszczona poniżej tabela ze średnimi ocenami będzie stanowiła zbiór danych do analizy. W wierszach zostały zamieszczone poszczególne stwierdzenia reprezentujące cechy, a w kolumnach oceniane obiekty, czyli marki. Taki układ danych, choć trochę nienaturalny (zwykle obiekty reprezentują wiersze a cechy kolumny), jest wygodniejszy z punktu widzenia prowadzenia analizy. Skalowanie możemy wykonać zarówno dla wierszy, jak i dla kolumn, więc dla algorytmu układ danych jest bez znaczenia.
Rysunek 2. Średnie oceny urządzeń do samoobrony
Tabelę należy odczytywać w następujący sposób: zdaniem respondentów dana cecha pasuje w X% do danej marki. Przykładowo : marce A w 80% przypisano odruchowe uruchamianie, a w 100% trudność do neutralizacji przez napastnika. Dla porównania produkty marki B realizują obydwa te założenia w 100%.
Obliczanie odległości euklidesowej pomiędzy poszczególnymi markami jest intuicyjne. Należy obliczyć kwadraty różnic w każdym z wierszy, następnie zsumować wszystkie wartości i na końcu obliczyć pierwiastek z takiego działania. Przykładowo, odległość pomiędzy marką A i marką B wynosi 70,711 a odległość pomiędzy A oraz C wynosi 128,062. Marka B jest zdecydowanie bliżej marce A niż marka C. W analogiczny sposób można obliczyć odległości pomiędzy wszystkimi analizowanymi obiektami.
Procedura skalowania wielowymiarowego przebiega w kilku krokach. W pierwszym obliczana jest macierz odległości pomiędzy analizowanymi obiektami. Następnie odległości te są przeskalowywane w sposób optymalny z punktu widzenia algorytmu ALSCAL. W kolejnym kroku wykonana zostaje przez algorytm dekompozycja macierzy odległości na wektory i wartości osobliwe. Dzięki temu możliwe jest wskazanie dwóch wymiarów, które w najlepszym stopniu odwzorowują początkowe odległości. Na tej podstawie tworzony jest układ współrzędnych, na którym zostaną umieszczone punkty reprezentujące analizowane obiekty. Po przygotowaniu współrzędnych i obliczeniu różnicy pomiędzy macierzą odległości przeskalowanych, a odtworzonych na podstawie współrzędnych poszczególnych obiektów, algorytm ALSCAL iteracyjnie dopasowuje ostateczne rozwiązanie tak, by odwzorowanie na mapie było jak najlepsze[2].
Przyjrzyjmy się analizie w praktyce wykorzystując oprogramowanie PS IMAGO PRO. Procedura ALSCAL znajduje się w menu ANALIZA -> SKALOWANIE -> WIELOWYMIAROWE ALSCAL.
Rysunek 3. Okno definiowania analizy ALSCAL
Po wybraniu analizowanych zmiennych (w naszym przypadku każda zmienna reprezentuje oceny danej marki) należy w sekcji Odległości zdefiniować układ danych. Opcja Dane to odległości pozwala wykorzystać macierz odległości (o różnym kształcie), natomiast opcja Utwórz odległości na podstawie danych, służy do przygotowania takiej macierzy na podstawie surowych danych.
Okno Utwórz miarę na podstawie danych pozwala na wybór miary odległości, opcji standaryzacji oraz dodatkowo o wskazanie czy chcemy porównywać odległości pomiędzy obserwacjami (wiersze) czy zmiennymi (kolumny).
Kolejne okno dostępne pod przyciskiem Model pozwala na ustawienie szczegółowych parametrów modelu. Głównie odnosi się do danych w formie złożonych macierzy odległości, natomiast w przypadku danych surowych należy wybrać jedynie poziom pomiaru zmiennych. Dla analizowanych marek będzie to poziom ilorazowy.
Okno Opcje służy do zamawiania obiektów wynikowych modelu oraz ustawiania kryteriów zbieżności algorytmu. Aby uzyskać mapę percepcyjną i miary dopasowania, należy w sekcji Pokaż wybrać opcje: Wykresy grupowe oraz Macierz danych.
Skalowanie wielowymiarowe – interpretacja wyników i diagnostyka modelu
Raport procedury skalowania wielowymiarowego zawiera kilka obiektów. Znajdują się w nim macierze rzeczywistych i przeskalowanych odległości, współrzędne obiektów na mapie oraz podsumowanie kolejnych iteracji i ostatecznego modelu. Tym, który interesuje nas w tym momencie najbardziej, jest mapa percepcyjna stanowiąca jak najlepsze odwzorowanie odległości pomiędzy analizowanymi markami. Na jej podstawie możemy wskazać grupy produktów, którym respondenci przypisywali podobne cechy.
Rysunek 4. Mapa percepcyjna przedstawiająca marki
Podczas interpretacji mapy percepcyjnej będącej wynikiem skalowania wielowymiarowego, koncentrujemy się na interpretacji odległości pomiędzy obiektami. Wyraźnie widać, że marki C i D są bardzo podobnie postrzegane przez uczestników badania. Marki A, B, H również stanowią osobną, wyraźnie wyodrębnioną grupę i, co ważne, jest to grupa bliska marce idealnej. Pozostałe produkty stanowią raczej osobne byty i zostały przedstawione na mapie jako obiekty oddalone od pozostałych, które ciężko zaklasyfikować do pojedynczego skupienia. Dodatkowo, jeżeli posiadamy wiedzę na temat cech różnicujących poszczególne marki, możemy również pokusić się o interpretację wymiarów, na których rozrzucone są analizowane obiekty.
Ogólnej diagnostyki modelu można dokonać oceniając relację pomiędzy odległościami odtworzonymi na podstawie współrzędnych a dystansami pomiędzy obiektami zamieszczonymi w macierzy przeskalowanych odległości.
Rysunek 5. Jakość dopasowania modelu
RSQ to po prostu znany z regresji liniowej R-kwadrat, czyli kwadrat korelacji pomiędzy odległościami odtworzonymi a przeskalowanymi. Im bliższy 1 tym lepiej i jego wartość może być interpretowana jako procent zmienności wyjaśnionej przez model. Wartość STRESS ma z kolei odwrotne znaczenie – reprezentuje ona niedopasowanie modelu do danych, przyjmuje wartości od 0 do 1 i im jest mniejsza tym lepiej. Obliczany jest on na podstawie różnic pomiędzy odległościami przeskalowanymi a odtworzonymi przez model[3]. Ponieważ Stress obliczany jest na podstawie odległości a RSQ na podstawie korelacji między nimi, to niestety te dwie miary nie sumują się do 1.
W tym miejscu kończymy tekst ogólnie prezentujący skalowanie wielowymiarowe i podstawowe zasady interpretacji modelu. Jak widać skalowanie wielowymiarowe może być pomocne w wyznaczeniu pozycji marki. Możliwe jest określenie jakie są przewagi i najważniejsze cechy naszych produktów lub usługi, co pozwala lepiej dopasować przekaz promocyjny do oczekiwań potencjalnych klientów. Wizualizacja skalowania wielowymiarowego w postaci mapy percepcji umożliwia również łatwą i intuicyjną interpretację wyników - najbliżej siebie są obiekty najbardziej podobne, najdalej te, które najbardziej się różnią.
[1] Porównaj: M. Rószkiewicz, Analiza klienta, Kraków 2011, s. 166.