Jednym z częstych zadań, które stoją przed analitykiem jest zbadanie, czy pomiędzy zmiennymi występuje zależność, a w dalszej kolejności – jaki ma ona charakter. W przypadku zmiennych jakościowych chcemy ustalić, czy przynależność do kategorii jednej zmiennej różnicuje rozkład kategorii drugiej zmiennej.
Dlatego też budujemy tabele krzyżowe, które pozwalają na zaobserwowanie występowania bądź niewystępowania zależności między zmiennymi w próbie. Jeśli mamy do czynienia z próbą reprezentatywną, kolejnym krokiem może być wnioskowanie statystyczne, czyli etap analizy, który ma na celu stwierdzenie, czy zaobserwowane zależności możemy uogólnić na populację. Tutaj, dla zmiennych o jakościowym poziomie pomiaru, wykorzystujemy test chi-kwadrat. Dla dociekliwego analityka jest to jednak dopiero początek drogi, bowiem test chi-kwadrat mówi tylko o istnieniu bądź nieistnieniu zależności, natomiast nie mówi nic o sile tej zależności (do badania siły związku między zmiennymi służy osobna grupa miar) ani o tym, które konkretnie kategorie zmiennych istotnie się od siebie różnią. Ta ostatnia kwestia to domena testów proporcji kolumnowych.
Tabela 1 przedstawia rozkład odpowiedzi na pytanie o częstotliwość korzystania z Internetu, w zależności od statusu zawodowego respondentów.
W grupie uczniów i studentów oraz w grupie pracujących zawodowo, dominowała odpowiedź „codziennie lub prawie codziennie”. Z kolei pozostałe grupy (emeryci i renciści, bezrobotni, zajmujący się domem) najczęściej wybierały odpowiedź „w ogóle nie korzystam”. Ale nawet pomiędzy tymi grupami można zobaczyć spore różnice w rozkładach odpowiedzi. Na przykład, jeśli porównamy osoby zajmujące się domem, do emerytów i rencistów, zobaczymy, że ta pierwsza grupa jest bardziej niejednorodna wewnętrznie. Wśród zajmujących się domem jest niemal tyle samo osób korzystających z Internetu codziennie, co nie korzystających z niego wcale. Podobnie, gdy porównamy uczniów i studentów do pracujących zawodowo, zobaczymy, że wśród uczniów i studentów niemal wszyscy (ponad 96%) korzystają z Internetu co najmniej kilka razy w tygodniu. Wśród pracujących zawodowo, jest stosunkowo dużo (prawie 26%) osób, które z Internetu w ogóle nie korzystają.
Warto teraz zadać sobie pytanie, które z zaobserwowanych różnic okazałyby się istotne statystycznie. Aby się tego dowiedzieć, możemy wykorzystać testy proporcji kolumnowych, zwane testami z. Statystyka z odpowiada statystyce chi-kwadrat wyliczanej dla każdej pary komórek osobno (w ramach danego wiersza tabeli). Poziom istotności powinien być następnie poddany korekcie ze względu na fakt realizacji porównań wielokrotnych. W naszym przykładzie wykorzystana została korekta metodą Bonferroniego, a wyniki w postaci liter znajdują się w Tabeli 2.
Popatrzmy najpierw na korzystających z Internetu codziennie lub prawie codziennie (ostatni wers tabeli, nie licząc podsumowania Ogółem). Pracownicy otrzymali oznaczenie „a”. Czy jakakolwiek inna kategoria w tym samym wierszu również ma to oznaczenie? Tak, bezrobotni oraz zajmujący się domem. Oznacza to, że te kategorie nie różnią się istotnie od pracowników, jeśli chodzi o codzienne korzystanie z Internetu. Uczniowie i studenci to kategoria, która różni się istotnie od wszystkich pozostałych – tylko oni mają literę „b”. Podobnie emeryci i renciści – są inni niż wszystkie pozostałe kategorie, gdyż nigdzie więcej nie pojawia się litera „c”. W ten sam sposób można analizować każdy wiersz tabeli. Przykładowo, spójrzmy na wiersz, który odnosi się do odpowiedzi „kilka razy w miesiącu”. W komórce z odsetkiem emerytów i rencistów, pojawiły się litery „b” i „c”. Oznacza to, że liczba emerytów i rencistów korzystających z Internetu kilka razy w miesiącu nie różni się istotnie ani od uczniów i studentów (oznaczonych literą „b”), ani od bezrobotnych („posiadających” litery „b” i „c”), ani od zajmujących się domem (ze względu na literę „c”).
Jak widać, w komórkach tabeli krzyżowej mogą się znajdować nie tylko liczby, ale także litery, a umiejętność odczytywania ich znaczenia, daje możliwość pogłębienia wykonywanych analiz.