Pojemność tabeli, czyli co można wrzucić do komórek obok liczb?

Tekst przeczytasz w:  3 minuty

Czy przynależność do kategorii jednej zmiennej różnicuje rozkład kategorii drugiej zmiennej?

Jednym z częstych zadań, które stoją przed analitykiem jest zbadanie, czy pomiędzy zmiennymi występuje zależność, a w dalszej kolejności – jaki ma ona charakter. W przypadku zmiennych jakościowych chcemy ustalić, czy przynależność do kategorii jednej zmiennej różnicuje rozkład kategorii drugiej zmiennej.

Chcesz dowiedzieć się więcej?

Zapraszamy na szkolenie:

ST 2a. Wizualizacja informacji z użyciem raportów tabelarycznych i wykresów

Dlatego też budujemy tabele krzyżowe, które pozwalają na zaobserwowanie występowania bądź niewystępowania zależności między zmiennymi w próbie. Jeśli mamy do czynienia z próbą reprezentatywną, kolejnym krokiem może być wnioskowanie statystyczne, czyli etap analizy, który ma na celu stwierdzenie, czy zaobserwowane zależności możemy uogólnić na populację. Tutaj, dla zmiennych o jakościowym poziomie pomiaru, wykorzystujemy test chi-kwadrat. Dla dociekliwego analityka jest to jednak dopiero początek drogi, bowiem test chi-kwadrat mówi tylko o istnieniu bądź nieistnieniu zależności, natomiast nie mówi nic o sile tej zależności (do badania siły związku między zmiennymi służy osobna grupa miar) ani o tym, które konkretnie kategorie zmiennych istotnie się od siebie różnią. Ta ostatnia kwestia to domena testów proporcji kolumnowych.

Tabela 1 przedstawia rozkład odpowiedzi na pytanie o częstotliwość korzystania z Internetu, w zależności od statusu zawodowego respondentów.

tabela krzyżowa

W grupie uczniów i studentów oraz w grupie pracujących zawodowo, dominowała odpowiedź „codziennie lub prawie codziennie”. Z kolei pozostałe grupy (emeryci i renciści, bezrobotni, zajmujący się domem) najczęściej wybierały odpowiedź „w ogóle nie korzystam”. Ale nawet pomiędzy tymi grupami można zobaczyć spore różnice w rozkładach odpowiedzi. Na przykład, jeśli porównamy osoby zajmujące się domem, do emerytów i rencistów, zobaczymy, że ta pierwsza grupa jest bardziej niejednorodna wewnętrznie. Wśród zajmujących się domem jest niemal tyle samo osób korzystających z Internetu codziennie, co nie korzystających z niego wcale. Podobnie, gdy porównamy uczniów i studentów do pracujących zawodowo, zobaczymy, że wśród uczniów i studentów niemal wszyscy (ponad 96%) korzystają z Internetu co najmniej kilka razy w tygodniu. Wśród pracujących zawodowo, jest stosunkowo dużo (prawie 26%) osób, które z Internetu w ogóle nie korzystają.

Warto teraz zadać sobie pytanie, które z zaobserwowanych różnic okazałyby się istotne statystycznie. Aby się tego dowiedzieć, możemy wykorzystać testy proporcji kolumnowych, zwane testami z. Statystyka z odpowiada statystyce chi-kwadrat wyliczanej dla każdej pary komórek osobno (w ramach danego wiersza tabeli). Poziom istotności powinien być następnie poddany korekcie ze względu na fakt realizacji porównań wielokrotnych. W naszym przykładzie wykorzystana została korekta metodą Bonferroniego, a wyniki w postaci liter znajdują się w Tabeli 2.

Tabela z wynikami testów proporcji kolumnowych z korektą Bonferroniego

Popatrzmy najpierw na korzystających z Internetu codziennie lub prawie codziennie (ostatni wers tabeli, nie licząc podsumowania Ogółem). Pracownicy otrzymali oznaczenie „a”. Czy jakakolwiek inna kategoria w tym samym wierszu również ma to oznaczenie? Tak, bezrobotni oraz zajmujący się domem. Oznacza to, że te kategorie nie różnią się istotnie od pracowników, jeśli chodzi o codzienne korzystanie z Internetu. Uczniowie i studenci to kategoria, która różni się istotnie od wszystkich pozostałych – tylko oni mają literę „b”. Podobnie emeryci i renciści – są inni niż wszystkie pozostałe kategorie, gdyż nigdzie więcej nie pojawia się litera „c”. W ten sam sposób można analizować każdy wiersz tabeli. Przykładowo, spójrzmy na wiersz, który odnosi się do odpowiedzi „kilka razy w miesiącu”. W komórce z odsetkiem emerytów i rencistów, pojawiły się litery „b” i „c”. Oznacza to, że liczba emerytów i rencistów korzystających z Internetu kilka razy w miesiącu nie różni się istotnie ani od uczniów i studentów (oznaczonych literą „b”), ani od bezrobotnych („posiadających” litery „b” i „c”), ani od zajmujących się domem (ze względu na literę „c”).

Analizy prezentowane w tym artykule zostały zrealizowane przy pomocy

PS IMAGO PRO

Jak widać, w komórkach tabeli krzyżowej mogą się znajdować nie tylko liczby, ale także litery, a umiejętność odczytywania ich znaczenia, daje możliwość pogłębienia wykonywanych analiz.

 


Udostępnij artykuł w social mediach:


Ustawienia dostępności
Wysokość linii
Odległość między literami
Wyłącz animacje
Przewodnik czytania
Czytnik
Wyłącz obrazki
Skup się na zawartości
Większy kursor
Skróty klawiszowe