Analiza czynnikowa

Tekst przeczytasz w: 5 minut.
Celem analizy czynnikowej jest wyjaśnienie jak największej części zmienności przy pomocy jak najmniejszej liczby zmiennych.

Dzięki tej metodzie statystycznej można zredukować ilość zmiennych poprzez zidentyfikowanie większych zbiorów (nazywanych czynnikami), które zawierają w sobie zmienne generujące wspólną wariancję (czyli kowariancję), a więc wyjaśniające to samo zjawisko. Zmienne wchodzące w skład takiego zbioru są więc ze sobą spójne (skorelowane), natomiast powstałe czynniki (zbiory) różnią się od siebie. Analiza czynnikowa pozwala również na klasyfikację zmiennych, czyli ustalenie struktury zmiennych.

Chcesz wiedzieć więcej?

Zapraszamy na szkolenie MC 3a. Pozycjonowanie z wykorzystaniem map percepcyjnych i technik skalowania optymalnego

 

Analizę czynnikową możemy zatem wykorzystać do wykrycia głównych motywów zakupu czy też poznania najważniejszych predyspozycji na wybrane stanowisko np. menadżerskie. W zbiorze wielu zmiennych możemy zmniejszyć ich liczbę tworząc czynniki takie jak zmienne emocjonalne, społeczne, ekonomiczne. Dzięki takiemu zabiegowi, łatwiej będzie również interpretować otrzymane wyniki.

 

Eksploracyjna a konfirmacyjna analiza czynnikowa

Analiza czynnikowa może być wykorzystana zarówno jako technika eksploracyjna, jak i konfirmacyjna. W przypadku eksploracyjnej analizy czynnikowej mamy do czynienia z sytuacją, w której identyfikacji liczby czynników dokonujemy ad hoc na podstawie dostępnych danych.
To podejście może być szczególnie przydatne, gdy działamy na zbiorze danych zawierającym wiele zmiennych,  których struktura nie jest jasno określona. Przykładem może tu być badanie satysfakcji klienta czy też oceny danego produktu – zmienne mogą grupować się w takie czynniki jak satysfakcja z samego produktu, z obsługi klienta, ze społecznych lub prestiżowych aspektów, czy też z  praktyczności badanego produktu. Niektóre czynniki mogą być oczywiste, natomiast w niektórych sytuacjach merytoryczna interpretacja otrzymanych czynników może wymagać więcej eksperckiej wiedzy.

Konfirmacyjna analiza czynnikowa, wykorzystywana w modelowaniu równań strukturalnych, na podstawie wiedzy teoretycznej a priori zakłada określoną liczbę czynników i to, które zmienne powinny być silnie naładowane określonym czynnikiem. Ta postać analizy czynnikowej jest często wykorzystywana do weryfikowania nowych rozwiązań w kontekście dobrze poznanych struktur zjawisk. Taka sytuacja ma miejsce np. przy konstruowaniu nowych kwestionariuszy psychologicznych mających diagnozować zjawiska silnie ugruntowane w teorii. Konfirmacyjna analiza czynnikowa pozwala więc na testowanie postawionych hipotez dotyczących struktury danych. Jako przykład posłużyć tutaj może analiza cech osobowości zgodnie z modelem Wielkiej Piątki – wyróżnianych jest tutaj pięć głównych wymiarów osobowości, które mierzone są za pomocą większej ilości podskal. Jednym z czynników jest sumienność, w której skład wchodzą zmienne, które powinny ze sobą korelować, m.in.: kompetencje, skłonność do porządku czy obowiązkowość.

 

Metody analizy czynnikowej

Istnieje wiele technik redukcji ilości zmiennych. Jedną z częściej stosowanych jest analiza głównych składowych, która pozwala zapisać zmienne wyjściowe w postaci liniowej kombinacji nieskorelowanych zmiennych obserwowanych nazywanych składowymi (analogicznie do czynników). W PS IMAGO PRO dostępne są również takie metody wyodrębniania czynników, jak: nieważonych najmniejszych kwadratów, uogólnionych najmniejszych kwadratów, największej wiarygodności, osi głównych, alfa czy obrazu.

Jedną z metod określenia liczby czynników do wyodrębnienia jest wykres osypiska i oparte na nim kryterium Cattella. By dokonać wyboru liczby składowych, szuka się na wykresie takiego punktu, w którym wykres przestaje być stromy (przestaje się osypywać) i liczy się składowe (punkty) powyżej tego punktu. Ilość tych punktów stanowi ilość czynników, które zostaną wyodrębnione w analizie. W poniższym przykładzie (rys. 1) zdecydowalibyśmy się na wyodrębnienie trzech czynników.
Nieco mniej rygorystyczną metodą jest zastosowanie kryterium Kaisera, w którym liczba czynników determinowana jest ilością składowych z wartością własną większą od jedynki. Przy dużej liczbie wejściowych zmiennych istnieje jednak ryzyko, że kryterium to wyodrębni dużą ilość słabszych składowych i tym samym będzie w niewielkim stopniu redukowało ilość danych.
Metody te są oczywiście wykorzystywane przy eksploracyjnej analizie czynnikowej, w której nie wiemy z wyprzedzeniem jakiej ilości czynników będziemy się spodziewać.

 

Rys.1 Wykres osypiska

Rys.1 Wykres osypiska

 

Oprócz samego wyodrębnienia czynników, analiza czynnikowa pozwala również na dokonywanie rotacji. Ta metoda pozwala tak obrócić i dopasować osie reprezentujące czynniki, aby ich interpretacja była łatwiejsza (rys. 2). W PS IMAGO PRO dostępnych jest pięć metod rotacji: Varimax, prosta Oblimin, Quartimax, Equamax oraz Promax. Różnią się od siebie pewnymi założeniami oraz algorytmami według których są przeprowadzane.

 

Rys. 2 Wykres korelacji dwóch zmiennych po obrocie osi współrzędnych.

Rys. 2 Wykres korelacji dwóch zmiennych po obrocie osi współrzędnych.

 

Założenia analizy czynnikowej

Podstawowym założeniem analizy czynnikowej jest ilościowy poziom pomiaru uwzględnianych zmiennych. Każda z nich powinna mieć też dużą wariancję – jeśli grupa będzie zbyt homogeniczna, rozróżnienie uzyskanych czynników będzie znacząco trudniejsze. Dodatkowo, zmienne powinny mieć rozkład normalny, a ewentualne przypadki odstające być usunięte.

Jak zasygnalizowałam we wstępie tego artykułu, zmienne wykorzystywane w analizie muszą w pewien sposób ze sobą istotnie korelować, aby na tej podstawie móc następnie zredukować ich ilość. Obserwacje natomiast powinny być niezależne.

 

Analizy prezentowane w tym artykule zostały zrealizowane przy pomocy PS IMAGO PRO

Kolejną ważną kwestią jest wielkość i złożoność analizowanego zbioru danych. Aby móc otrzymać sensowe rozwiązanie, musimy dysponować stosowną liczbą zmiennych oraz obserwacji. Co to dokładnie oznacza? Po rekomendacje sięgnąć należy do literatury, gdzie znaleźć można zalecenia co najmniej 3-4 zmiennych (pozycji skali) do każdego potencjalnego czynnika (Fabrigar, Wegener, MacCallum, Strahar, 1999)[i] czy 5-10 obserwacji do każdej zmiennej (Gorsuch, 1983)[ii]. Rodzaj analizy czynnikowej (eksploracyjna, konfirmacyjna), a także charakter danych wpływają na to, ile obserwacji rzeczywiście jest potrzebnych do uzyskania wiarygodnych wyników (MacCallum, Widaman, Zhang, Hong, 1999)[iii]. Choć nie można wskazać tu idealnej, uniwersalnej wartości czy proporcji, jak zawsze – generalnie im większy zbiór danych, tym lepiej.

 

Podsumowanie

Analiza czynnikowa jest techniką redukcji wymiarów, która może posłużyć zarówno do konstruowania narzędzi pomiarowych, wskaźników złożonych, jak i koncepcji teoretycznych dotyczących struktury i powiązań zmiennych. Przeprowadzenie analizy czynnikowej wymaga jednak podjęcia szeregu arbitralnych decyzji dotyczących m.in. selekcji zmiennych do analizy, określenia liczby czynników, metody ich wyodrębniania czy rotacji. Wprowadzenie zmiennych, które są  słabo powiązane z pozostałymi może znacząco osłabić uzyskane rozwiązanie i znacząco zmienić układ zmiennych w poszczególnych czynnikach. Jeśli analiza czynnikowa wykorzystywana jest eksploracyjnie, warto przetestować kilka rozwiązań o różnej liczbie czynników i wybrać najlepszą wersję zarówno pod kątem otrzymanych wyników, jak i jej interpretowalności.

 

 

[i] Fabrigar L.R., Wegener D.T., MacCallum R.C., Strahar E.J. (1999) Evaluating use of exploratory factor analysis in psychological research. Psychological Methods, 4, 272-299.

[ii] Gorsuch, R. L. (1983). Factor analysis (2nd ed.). Hillsdale, NJ: Lawrence Erlbaum.

[iii] MacCallum, R. C., Widaman, K. F., Zhang, S., & Hong, S. (1999). Sample size in factor analysis. Psychological Methods, 4, 84-99.


Oceń artykuł:

Udostępnij artykuł w social mediach



Zostańmy w kontakcie!

Chcesz dostawać wiadomości o nowych wpisach na blogu i webinarach z zakresu analizy danych? Zapisz się na powiadomienia e-mail.