Pojemność tabeli, czyli co można wrzucić do komórek obok liczb?

Tekst przeczytasz w: 3 minuty.
Czy przynależność do kategorii jednej zmiennej różnicuje rozkład kategorii drugiej zmiennej?

Sprawdź również:

Jednym z częstych zadań, które stoją przed analitykiem jest zbadanie, czy pomiędzy zmiennymi występuje zależność, a w dalszej kolejności – jaki ma ona charakter. W przypadku zmiennych jakościowych chcemy ustalić, czy przynależność do kategorii jednej zmiennej różnicuje rozkład kategorii drugiej zmiennej.

Chcesz dowiedzieć się więcej o raportowaniu?

Zapraszamy na szkolenie ST 2a. Wizualizacja informacji z użyciem raportów tabelarycznych i wykresów.

Dlatego też budujemy tabele krzyżowe, które pozwalają na zaobserwowanie występowania bądź niewystępowania zależności między zmiennymi w próbie. Jeśli mamy do czynienia z próbą reprezentatywną, kolejnym krokiem może być wnioskowanie statystyczne, czyli etap analizy, który ma na celu stwierdzenie, czy zaobserwowane zależności możemy uogólnić na populację. Tutaj, dla zmiennych o jakościowym poziomie pomiaru, wykorzystujemy test chi-kwadrat. Dla dociekliwego analityka jest to jednak dopiero początek drogi, bowiem test chi-kwadrat mówi tylko o istnieniu bądź nieistnieniu zależności, natomiast nie mówi nic o sile tej zależności (do badania siły związku między zmiennymi służy osobna grupa miar) ani o tym, które konkretnie kategorie zmiennych istotnie się od siebie różnią. Ta ostatnia kwestia to domena testów proporcji kolumnowych. 

Tabela 1 przedstawia rozkład odpowiedzi na pytanie o częstotliwość korzystania z Internetu, w zależności od statusu zawodowego respondentów. 

tabela krzyżowa

W grupie uczniów i studentów oraz w grupie pracujących zawodowo, dominowała odpowiedź „codziennie lub prawie codziennie”. Z kolei pozostałe grupy (emeryci i renciści, bezrobotni, zajmujący się domem) najczęściej wybierały odpowiedź „w ogóle nie korzystam”. Ale nawet pomiędzy tymi grupami można zobaczyć spore różnice w rozkładach odpowiedzi. Na przykład, jeśli porównamy osoby zajmujące się domem, do emerytów i rencistów, zobaczymy, że ta pierwsza grupa jest bardziej niejednorodna wewnętrznie. Wśród zajmujących się domem jest niemal tyle samo osób korzystających z Internetu codziennie, co nie korzystających z niego wcale. Podobnie, gdy porównamy uczniów i studentów do pracujących zawodowo, zobaczymy, że wśród uczniów i studentów niemal wszyscy (ponad 96%) korzystają z Internetu co najmniej kilka razy w tygodniu. Wśród pracujących zawodowo, jest stosunkowo dużo (prawie 26%) osób, które z Internetu w ogóle nie korzystają.

Warto teraz zadać sobie pytanie, które z zaobserwowanych różnic okazałyby się istotne statystycznie. Aby się tego dowiedzieć, możemy wykorzystać testy proporcji kolumnowych, zwane testami z. Statystyka z odpowiada statystyce chi-kwadrat wyliczanej dla każdej pary komórek osobno (w ramach danego wiersza tabeli). Poziom istotności powinien być następnie poddany korekcie ze względu na fakt realizacji porównań wielokrotnych. W naszym przykładzie wykorzystana została korekta metodą Bonferroniego, a wyniki w postaci liter znajdują się w Tabeli 2.  

Tabela z wynikami testów proporcji kolumnowych z korektą Bonferroniego

Popatrzmy najpierw na korzystających z Internetu codziennie lub prawie codziennie (ostatni wers tabeli, nie licząc podsumowania Ogółem). Pracownicy otrzymali oznaczenie „a”. Czy jakakolwiek inna kategoria w tym samym wierszu również ma to oznaczenie? Tak, bezrobotni oraz zajmujący się domem. Oznacza to, że te kategorie nie różnią się istotnie od pracowników, jeśli chodzi o codzienne korzystanie z Internetu. Uczniowie i studenci to kategoria, która różni się istotnie od wszystkich pozostałych – tylko oni mają literę „b”. Podobnie emeryci i renciści – są inni niż wszystkie pozostałe kategorie, gdyż nigdzie więcej nie pojawia się litera „c”. W ten sam sposób można analizować każdy wiersz tabeli. Przykładowo, spójrzmy na wiersz, który odnosi się do odpowiedzi „kilka razy w miesiącu”. W komórce z odsetkiem emerytów i rencistów, pojawiły się litery „b” i „c”. Oznacza to, że liczba emerytów i rencistów korzystających z Internetu kilka razy w miesiącu nie różni się istotnie ani od uczniów i studentów (oznaczonych literą „b”), ani od bezrobotnych („posiadających” litery „b” i „c”), ani od zajmujących się domem (ze względu na literę „c”).

Analizy prezentowane w tym artykule zostały zrealizowane przy pomocy PS IMAGO PRO

Jak widać, w komórkach tabeli krzyżowej mogą się znajdować nie tylko liczby, ale także litery, a umiejętność odczytywania ich znaczenia, daje możliwość pogłębienia wykonywanych analiz.  

 


Oceń artykuł:

Udostępnij artykuł w social mediach



Zostańmy w kontakcie!

Chcesz dostawać wiadomości o nowych wpisach na blogu i webinarach z zakresu analizy danych? Zapisz się na powiadomienia e-mail.

Ustawienia dostępności
Zwiększ wysokość linii
Zwiększ odległość między literami
Wyłącz animacje
Przewodnik czytania
Czytnik
Większy kursor