Innym przykładem może tu być związek między porą roku a ilością wypitych filiżanek kawy na dzień. Z poniższej tabeli (tab. 1) możemy dowiedzieć się, że stosunek korelacyjny eta (η) dla tego związku wynosi η = 0,51. Zmienna ilościowa (ilość kawy) jest tu wyjaśniania w podziale na czynniki (pory roku), podobnie jak w przypadku analizy wariancji ANOVA.
Tabela 1. Wartości korelacji między zmiennymi
pora roku a ilość spożywanej kawy.
Interpretacja stosunku korelacyjnego eta
Współczynnik eta może przyjmować wartości z zakresu od 0 do 1, gdzie wartości bliskie 1 świadczą o silnej korelacji, a bliższe 0 o słabszej. W przeciwieństwie do tradycyjnych współczynników korelacji, wartości te nie mogą być ujemne, co nie pozwala na interpretację kierunku związku. Wynika to jednak z samego rodzaju danych, do których wykorzystuje się stosunek korelacyjny eta. Zazwyczaj jedna ze zmiennych będzie bowiem mierzona na skali nominalnej, która nie pozwala na uporządkowanie wartości w logicznym porządku. Nie możemy więc powiedzieć, że np. kolor oczu zwiększa się lub maleje pod wpływem innej zmiennej – czyli nie możemy określić kierunku związku.
Eta-kwadrat
Współczynnik eta może nam również dostarczyć informację, jaki procent wariancji zmiennej zależnej można wyjaśnić poprzez niezależną zmienną kategoryzującą. Podobnie jak przy współczynniku determinacji R 2, wyprowadzanym z klasycznego współczynnika korelacji r-Pearsona, aby otrzymać wskaźnik wielkości (siły) efektu, wartość stosunku korelacyjnego eta należy podnieść do kwadratu.
Współczynnik eta-kwadrat jest często wykorzystywany jako uzupełnienie analizy wariancji i pozwala na określenie wielkości badanego efektu, czyli tego, jaka proporcja całkowitej wariancji zmiennej zależnej wyjaśniana jest przez badany efekt. Pozwala określić w jakim stopniu np. ilość złożonych zamówień rzeczywiście zależy od dnia tygodnia, a nie od innych czynników.
Eta-kwadrat może przyjmować wartości z zakresu od 0 do 1. Po przemnożeniu wyniku przez 100%, otrzymamy wartość procentową wyjaśnianej zmienności. Wracając do wcześniejszego przykładu, wielkość efektu dla zależności między porą roku a ilością wypijanej kawy będzie wynosiła η 2 = 0,26 (tab. 1), czyli 26%.
Stosunek korelacyjny eta a analiza wariancji i współczynnik korelacji
Stosunek korelacyjny eta związany jest bezpośrednio z analizą wariancji. Wartość eta-kwadrat wyraża stosunek międzygrupowej sumy kwadratów do całkowitej sumy kwadratów. Przykładowo, z tabeli ANOVA dla zależności między porą dnia a ilością kawy (tab. 2) należy podzielić 19,651 (Między grupami) przez 76,98 (Ogółem): 19,651 / 76,98 = 0,255.
Tabela 2. Wyniki analizy wariancji dla związku między porą roku a ilością spożywanej kawy.
W przypadku, gdy zmienna kategoryzująca jest binarna, czyli dzieli próbę na dwie grupy, otrzymana wartość eta będzie równa wartości współczynnika korelacji r-Pearsona oraz analogicznie eta-kwadrat równa będzie R2. Najczęstszą taką sytuacją jest podział próby według płci. Dla przykładu, możemy chcieć sprawdzić, czy wzrost jest zależny od płci. Otrzymane wyniki pokazują, że wartość eta η = 0,81 (tab. 3) oraz r = 0,81 (tab. 4) są sobie równe.
Tabela 3. Wartości eta i eta-kwadrat dla związku
między zmiennymi płeć a wzrost.
Tabela 4. Wartość korelacji r-Pearsona dla związku
między zmiennymi płeć a wzrost.
Podsumowanie
Współczynnik eta jest miarą zależności, wykorzystywaną do analizowania zależności między zmienną mierzoną na skali nominalnej a zmienną ilościową (interwałową lub ilorazową). Eta-kwadrat, którą można wyprowadzić bezpośrednio z analizy wariancji pozwala na ocenę wielkości efektu, czyli jaki procent wariancji zmiennej zależnej można wyjaśnić poprzez niezależną zmienną kategoryzującą.