Dodatkowy predyktor w analizie na pierwszy rzut oka komplikuje relację dwóch zmiennych i utrudnia jej odczytanie przez badacza. Nierzadko jednak jego wykorzystanie jest niezbędne, aby prawidłowo zinterpretować zmiany zmiennej zależnej. Czasami jest konieczne z punktu widzenia przyjętej przez badacza koncepcji teoretycznej. Wszystko oczywiście zależy od stawianych pytań oraz testowanych hipotez badawczych. Wykorzystując przykładowe dane dotyczące opinii na temat spotu reklamowego przyjrzymy się bliżej możliwym relacjom pomiędzy dwoma predyktorami a zmienną przewidywaną. Narzędziem, które wykorzystamy, będą tabele użytkownika dostępne w programie IBM SPSS Statistics / PS IMAGO PRO. Pomocne okażą się również wykresy i wizualizacje. Wnioski uzyskane na podstawie analizy tabelarycznej mogą być wykorzystane podczas pracy z wielowymiarowymi technikami statystycznymi takimi jak regresja wieloraka (liniowa, logistyczna), czy analiza wariancji.
Chcesz dowiedzieć się więcej o statytsycznej analizie danych?
Zapraszamy na szkolenie ST 1. Podstawy statystyki dla każdego z wykorzystaniem IBM SPSS Statistics / PS IMAGO PRO
Jaki może być efekt wprowadzenia trzeciej zmiennej do analizy? Maria Nawojczyk dokonała w swoim podręczniku zestawienia potencjalnych oddziaływań trzeciej zmiennej:[1]
- Brak wpływu na zaobserwowaną relację
- Hipoteza alternatywna wyjaśniająca zmiany zmiennej przewidywanej
- Trzecia zmienna może warunkować wystąpienie związku lub wpływać na jego kształt
- Trzecia zmienna może całkowicie lub częściowo wytłumaczyć zaobserwowaną relację
Tabela 1. Oceny propozycji spotu reklamowego
Zacznijmy od początku. Pewna firma z branży FMCG przeprowadziła badania pod kątem opinii na temat nowego spotu reklamowego. Badanie zostało zrealizowane przy pomocy ankiety internetowej – respondenci oglądali spot, który następnie poddawali ocenie. Zostali także zapytani o płeć, wiek oraz miejsce zamieszkania. Dodatkowo udzielali odpowiedzi na temat znajomości nazwy firmy oraz spożywania jej produktów. Poniżej zaprezentowane zostały wyniki pytania o ocenę propozycji spotu reklamowego. Wykorzystałem w tym celu dostępny w PS IMAGO PRO wykres tabelowy. Szybki przegląd odpowiedzi nie dostarcza rozstrzygających informacji. Spot podobał się ponad 33% badanych, nie spodobał się 26%, natomiast 40% respondentów miało do niego obojętny stosunek. Analizowana propozycja reklamy nie wzbudziła więc szczególnego entuzjazmu, ale też nie należy jej przekreślać. Podstawowym predyktorem, który zdaniem zleceniodawców powinien kształtować ocenę spotu jest wiek badanego – w kreacji reklamowej występowali głównie młodzi ludzie i to właśnie do młodych był w założeniu skierowany przekaz. Sprawdźmy, czy wyniki ankiety odzwierciedlają zależność między wiekiem badanych o oceną spotu. W poniższej tabeli wiek badanych został pogrupowany w 3 kategorie, które są kluczowe z punktu widzenia segmentacji klientów w analizowanej firmie. Dla ułatwienia odczytu pokolorowałem tabelę przy pomocy procedury dostępnej w PS IMAGO PRO - najpopularniejsze odpowiedzi zaznaczone są największym nasyceniem koloru.
Tabela 2. Zależność pomiędzy wiekiem a oceną spotu
Zgodnie z oczekiwaniami autorów spotu możemy zaobserwować umiarkowaną, ujemną korelację pomiędzy naszymi zmiennymi: spot zyskał najwyższą akceptację w najmłodszej kategorii wiekowej, a jego ocena spada wraz ze wzrostem wieku badanych. Test chi-kwadrat pozwolił odrzucić hipotezę zerową o braku związku pomiędzy zmiennymi (przy założeniu losowości naszej próby). Tau-b Kendalla przyjmuje wartość -0,18. Zakładana monotoniczna zależność istnieje, choć jest dosyć słaba.
Przypadek 1: brak wpływu na zależność
Konsumentami reklamowanego produktu są głównie młode osoby, więc możemy przyjąć, że spot powinien spodobać się przede wszystkim badanym z najmłodszej kategorii. Odmiennie ma się sprawa w przypadku płci – produkt nie jest zróżnicowany pod tym kątem, dlatego też pożądanym stanem jest brak wpływu tej zmiennej zarówno na oceny spotu, jak i na zależność ocen od wieku. W naszej próbie mężczyźni nieznacznie przeważali nad kobietami (53% : 47%). Jak pokazują wyniki płeć nie różnicowała ocen spotu. Mimo pewnych różnic nie korelowała również z kategorią wiekową. Czy jednak wpłynęła na relację wieku z ocenami kreacji reklamowej? Odpowiedź przynosi zamieszczona poniżej tabela, w której kategoria wiekowa została zagnieżdżona w zmiennej płeć. Takie tabele można z łatwością budować w PS IMAGO PRO za pomocą przyjaznego kreatora Tabel Użytkownika.
Tabela 3. Wpływ płci na relację pomiędzy wiekiem a oceną kreacji reklamowej
Można stwierdzić, że kształt zaobserwowanej uprzednio relacji nie uległ znaczącej zmianie. Zarówno wśród kobiet, jak i wśród mężczyzn obserwujemy słabą, ujemną korelację pomiędzy wiekiem a ocenami propozycji spotu promocyjnego. Z naszego punktu widzenia jest to informacja pożądana, choć to zawsze zależy od celów badania i przyjmowanych na wstępie założeń.
Przypadek 2: hipoteza alternatywna
W poprzednim przypadku rozważaliśmy przykład zmiennej, która nie była skorelowana z żadną z analizowanych zmiennych. Co jednak może się stać w sytuacji, w której wprowadzimy do analizy predyktor, który koreluje zarówno ze zmienną zależną, jak i zmienną niezależną? W naszym przypadku taką zmienną jest miejsce zamieszkania, dla ułatwienia zastosowaliśmy tu 2 kategorie (miasto – wieś).
Rysunek 1. Zależności pomiędzy miejscem zamieszkania a wiekiem i oceną spotu
Zależności pomiędzy zmiennymi są widoczne i choć nie są one zbyt silne to jednak są istotne statystycznie. Mieszkańcy wsi byli nieco starsi niż mieszkańcy miast. Widać również, że w miastach wypowiadano się na temat propozycji spotu bardziej pozytywnie niż na wsi. Przyjrzyjmy się teraz, jak wygląda powiązanie trzech analizowanych zmiennych.
Tabela 4. Wpływ miejsca zamieszkania na relację pomiędzy wiekiem a oceną kreacji reklamowej
Widzimy, że miejsce zamieszkania, podobnie jak płeć nie wpłynęło na relację między wiekiem respondenta a oceną spotu. W obydwu kategoriach związek jest monotoniczny (dominujące kategorie znajdują się na przekątnej), relacje są istotne (co potwierdzają testy Chi-kwadrat) a współczynniki tau-b Kendalla tylko nieznacznie się różnią (-0,18 dla mieszkańców wsi i -0,19 dla miast). Jak widać, zmienna, która jest istotnie związana z predyktorem i zmienną zależną niekoniecznie musi wpływać na ich wzajemną relację. Aby zbytnio nie komplikować modelu można ją rozpatrywać osobno i wykorzystać jako podstawę do budowy alternatywnego modelu wyjaśniającego.
Przypadek 3: zmienna poprzedzająca – moderator
O wiele ciekawsza dla badacza jest jednak sytuacja, w której nowa zmienna niezależna wyraźnie oddziałuje na zaobserwowany wcześniej związek. Możemy zaobserwować wówczas efekt interakcji w analizowany układzie, a nowowprowadzony predyktor nazywamy moderatorem zależności. Taka zmienna, wpływając na kształt obserwowanej relacji, znacząco pogłębia naszą analizę. Przywołajmy w tym miejscu definicję moderatora zaczerpniętą z książki Bogdana Wojciszke. „Moderator jakieś zależności to czynnik, który decyduje o jej występowaniu lub nie”[2].
Jak to wygląda w praktyce? Jakościowa zmienna moderująca zależność może znacząco wpłynąć na obserwowany wcześniej związek – może on zachodzić w odmienny sposób na różnych poziomach dodatkowego czynnika lub też w ogóle zachodzić lub nie w poszczególnych kategoriach trzeciej zmiennej. Moderacji może ulegać kierunek oraz siła zależności[3]. Podsumowując moderator to zmienna, która decyduje o charakterze zależności – jej kierunku, sile lub określa warunki jego występowania. W naszym przypadku zmienną moderującą zależność jest rozpoznawalność marki, która przyjmuje dwie możliwe wartości – respondent znał nazwę firmy dla której przygotowany był spot lub też jej nie znał. Przyjrzyjmy się jej wpływowi zobrazowanemu w zamieszczonej poniżej tabeli.
Tabela 5. Wpływ znajomości marki na relację pomiędzy wiekiem a oceną kreacji reklamowej
Jak widać, stwierdzona wcześniej zależność pomiędzy wiekiem respondenta a oceną propozycji spotu reklamowego tak naprawdę zachodzi wyłącznie wśród osób, które rozpoznają nazwę lub markę firmy. W takim wypadku zależność ta ulega niewielkiemu wzmocnieniu (tau-b Kendalla wzrasta do wartości -0,26). Jest to niezwykle cenna informacja dla zleceniodawców – w kreacji reklamowej obok samego produktu warto eksponować również logotyp czy też nazwę firmy, gdyż wzmacnia ona przekaz promocyjny. Powyższy wynik może również stanowić podpowiedź o konieczności przeprowadzenia kampanii wizerunkowej, gdyż znajomość marki (a być może także jej wizerunek) wpływa na odbiór kreacji reklamowej.
Znajomość marki jest najczęściej kluczową zmienną z punktu widzenia planowania kampanii reklamowej. Pozbawieni tej wiedzy na pierwszy rzut oka w ogóle usunęlibyśmy tę zmienną z modelu, ponieważ pozostaje ona w bardzo słabej relacji z (rozpatrywanymi osobno) wiekiem oraz oceną kreacji reklamowej. Nie jest to jednak regułą. Gdybyśmy posłużyli się automatycznym doborem zmiennych, w ogóle nie uwzględnilibyśmy jej w naszych analizach. A, jak widać w przedstawione tabeli, pełni ona ważną funkcję w kształtowaniu zależności pomiędzy wiekiem a opinią na temat spotu reklamowego. Jest to przykład ilustrujący, że należy ostrożnie pozbywać się predyktorów.
Przypadek 4: zmienna pośrednicząca – mediator
Ostatnim przypadkiem, który chciałbym przedstawić w niniejszym tekście, jest mediacja – czyli występowanie zmiennej pośredniczącej w analizowanej relacji. Ponownie odwołajmy się do wykładów z psychologii społecznej Bogdana Wojciszke. „Mediator (pośrednik) to tyle co proces lub stan psychiczny pośredniczący pomiędzy zmienną niezależną (przyczyną) a zmienną zależną (skutkiem). Znaleźć mediator jakieś zależności to tyle, co odpowiedzieć na pytanie dlaczego ona występuje, podczas gdy znaleźć moderator to tyle, co odpowiedzieć na pytanie kiedy (w jakich warunkach) ona występuje” [4]. Warto także dodać, że mediacja może mieć charakter całkowity i wówczas zmienna pośrednicząca w pełni wyjaśnia zaobserwowaną relację.
W efekcie o naszym pierwotnym związku możemy powiedzieć, że miał on charakter relacji pozornej i występował tylko z powodu nieuwzględnienia trzeciej zmiennej w analizie. Wreszcie mediacja może mieć również charakter częściowy – pierwotna relacja ulega wyraźnemu osłabieniu, ale nadal możemy ją zaobserwować w wynikach. Dodatkowy predyktor nie tłumaczy całościowo relacji pomiędzy pierwotnie analizowanymi zmiennymi[5]. Przetestujmy ostatni predyktor – zmienną niosącą informacje, czy respondent kupuje reklamowany produkt. Tabela, która uwzględnia nową zmienną w analizie została zamieszczona poniżej.
Tabela 6. Wpływ kupowania produktu na relację pomiędzy wiekiem a oceną kreacji reklamowej
Obserwujemy ciekawy efekt – pierwotna, monotoniczna zależność pomiędzy wiekiem a oceną kreacji reklamowej, którą obserwowaliśmy na przekątnej tabeli, uległa zakłóceniu, (choć trzeba przyznać, że nadal pozostaje ona istotna statycznie). Obecnie dominujące kategorie dla każdego wiersza tabeli znajdują się w kategorii „trudno powiedzieć” (dla osób, które nie kupują produktu) lub też w kategorii „podoba się” (dla osób, które produkt kupują). Można więc zaryzykować stwierdzenie, że osoby, które nie kupowały wcześniej produktu maja obojętny stosunek do spotu , a ci, którzy go kupowali wyrażają się o spocie w umiarkowanie pozytywnym tonie. Reklamowana przekąska przeznaczona jest głównie dla młodych osób i stąd też wyższe oceny kreacji reklamowej w najmłodszej grupie konsumentów. Można zapytać po co komplikować sobie życie wprowadzając do modelu zmienną, która znosi pierwotną zależność?
Odpowiedź jest prosta – ta zmienna pośredniczy w relacji pomiędzy wiekiem a odbiorem spotu reklamowego i może być kluczowa dla prawidłowego zrozumienia związku pomiędzy nimi. Efekt ten można zinterpretować w następujący sposób: wiek wpływa na chęć zakupu produktu - osoby młodsze są bardziej skłonne do zakupów niż osoby starsze (związek jest istotny statystycznie). Konsumenci postrzegają produkt lepiej niż osoby, które go nie kupują i to rzutuje na ocenę spotu. Aktualni konsumenci mogą kierować się modą lub przekonaniem o atrakcyjności tego właśnie produktu, a osoby, które nie są konsumentami – przekonaniem o niezdrowym charakterze tego typu przekąsek. Jest to jednak tylko jedna z możliwych interpretacji, wyciagnięcie wniosków wymagało odwołania się do dodatkowych informacji czy badań. Zamieszczone poniżej wykresy ilustrują omawiane relacje.
Rysunek 2. Zależności pomiędzy wiekiem, zakupami a oceną propozycji spotu
Podsumowując: wprowadzenie trzeciej zmiennej nie jest trudne, choć interpretacja jej wpływu na omawianą relację wymaga od badacza pewnej elastyczności i nieco dłuższego drążenia danych. Z pewnością pomocne w poszukiwaniach mogą okazać się właściwa teoria socjologiczna oraz wiedza ekspercka z danej dziedziny. Taka eksploracyjna analiza może również prowadzić do interesujących odkryć, a nawet obalić istniejące dotychczas przekonania.