Poziomy pomiaru

Tekst przeczytasz w: 7 minut.
Poziom pomiaru jest jedną z najważniejszych własności zmiennych. Warunkuje on, jakie testy statystyczne będą później w toku analizy dla badacza dostępne. Jakie jednak informacje konkretnie nam przekazuje? Poziom pomiaru to wzorzec dokonywania pomiaru, który umożliwia określenie i ocenę stopnia lub ilości danej zmiennej. Wzorce te, nazywane również skalami pomiarowymi, pozwalają na jasne i konkretne przedstawienie zmiennych.

Sprawdź również:

Skale pomiarowe

Wyróżnia się cztery podstawowe skale, poziomy pomiaru:

  1. Skala nominalna

Jest najniższym poziomem pomiaru, w którym jednostka analizy przypisywana jest do określonej kategorii zmiennej. Podział na kategorie musi spełniać dwa warunki: być wyczerpujący oraz rozłączny – w konsekwencji każda obserwacja musi być przypisana do jednej, odpowiedniej dla siebie kategorii. Przykładem może tu być płeć, kolor czy też kraj urodzenia. W ramach przypisania do poszczególnych grup nie ma jednak porządku ani hierarchii – symbolicznie często przypisujemy im kolejne liczby (np. 1 – kobieta, 2 – mężczyzna), jednak nie upoważnia nas to do wykonywania na nich działań algebraicznych. Wymagane jest to jednak zazwyczaj do pełnego wykorzystania programów statystycznych, w tym PS IMAGO PRO.

Chcesz wiedzieć więcej?

Zapraszamy na szkolenie ST 1. Podstawy statystyki dla każdego

Szczególnym przypadkiem nominalnego poziomu pomiaru są zmienne dychotomiczne, czyli kodowane zero-jedynkowo np. sukces na egzaminie (zdał/nie zdał). W sposób dychotomiczny mogą być kodowane również pytania wielokrotnego wyboru, gdzie każda możliwa odpowiedź będzie osobną zmienną. Choć z teoretycznego punktu widzenia, możemy powiedzieć, że np. kategoria zdał jest lepsza niż nie zdał, to w praktyce nie możemy rozpatrywać zmiennych dychotomicznych w kontekście hierarchii – dwie kategorie zawsze będą „obok siebie”.

  1. Skala porządkowa

Umożliwia uporządkowanie danych zgodnie z określoną hierarchią. Zakłada ona, że natężenie danej zmiennej stanowi continuum, na którym uporządkować można poszczególne jej kategorie. Jednym z takich przykładów może być stopień trudności wykonywanego zadania (np. łatwe, średnie, trudne), czy też poziom edukacji – od np. wczesnoszkolnej do wyższej. W tym wypadku należy jednak upewnić się co do charakteru posiadanych danych – jeśli okazało by się, że wśród kategorii są poszczególne rodzaje szkół np. liceum ogólnokształcące, technikum, szkoła branżowa, to zmienna ta będzie mierzona na poziomie nominalnym, nie można bowiem w logiczny sposób przypisać kategoriom porządku.

Skala porządkowa pozwala na określenie natężenia badanego zjawiska, np. że dana obserwacja jest większa, starsza, wymagająca więcej zasobów itp. Z punktu widzenia samych analiz, nie ma to znaczenia, czy porządek będzie rosnący czy malejący. Ważne, aby istniało logiczne następstwo kategorii.

Skala Likerta jest kolejnym przykładem porządkowego poziomu pomiaru. Stosowana często w psychologii i socjologii, charakteryzuje się ustosunkowaniem respondenta do podanego stwierdzenia poprzez wykorzystanie skali – zazwyczaj 1-5 lub 1-7. Na przykład:

Stwierdzenie: Produkty firmy X są innowacyjne.

Odpowiedź:

  1. Zdecydowanie się zgadzam.
  2. Zgadzam się.
  3. Nie mam zdania.
  4. Nie zgadzam się.
  5. Zdecydowanie się nie zgadzam.

Analizując później wyniki w grupie, możemy uzyskać zatem odpowiedź na pytanie, której firmy produkty są uznawane za bardziej innowacyjne. Nie można jednak na tej podstawie ustalić, jak duża jest różnica w tej innowacyjności.

  1. Skala interwałowa, przedziałowa

Dzięki skali przedziałowej możemy porównywać ze sobą dane i określać różnicę między nimi, czyli innymi słowy mierzyć ich odległość od siebie na wykorzystywanej skali. Wartości liczbowe poszczególnych zmiennych nie są więc już tylko symboliczne. Przedziałowy poziom pomiaru nadal nie będzie jednak posiadał zera bezwzględnego, absolutnego. Dobrym przykładem jest tu pomiar temperatury na skali Celsjusza – jeśli w dniu wczorajszym było 10 °C, a dzisiaj jest o 10 °C więcej, to bez większego wysiłku będziemy wiedzieć, że dziś jest 20 °C. Czy można jednak powiedzieć, że jest dwa razy cieplej? W przedstawionym przykładzie zapewne można by się jeszcze domyśleć. Co jednak gdyby wyjściowa temperatura wynosiła -5 °C?

Chcesz wiedzieć więcej?

Zapraszamy na szkolenie OB 1. PS IMAGO PRO / IBM SPSS Statistics. Praca z danymi i obiektami wynikowymi

Skala interwałowa pozwala nam więc na znalezienie odpowiedzi o ile różnią się poszczególne wartości.

  1. Skala ilorazowa, stosunkowa

Jest najbardziej dokładnym poziomem pomiaru. Skala ilorazowa pozwala bowiem na określenie (zgodnie z nazwą), o ile razy poszczególne wartości różnią się od siebie. Wracając do wcześniejszego przykładu, aby móc mierzyć temperaturę na skali stosunkowej, należy wykorzystać skalę Kelwina. Nazywana jest skalą bezwzględną, ponieważ zawiera ona zero absolutne. Choć jest ono jedynie założeniem teoretycznym (według fizyki jest to stan ustania wszelkich drgań cząsteczek, w praktyce niemożliwy do osiągnięcia), temperatury wyrażone na tej skali możemy już ze sobą dowolnie porównywać – teraz rzeczywiście 20 K będzie dwa razy większe od 10 K.

Innym przykładem jest wiek samochodu. Jeśli będzie on przedstawiony jako rocznik pojazdu (np. 2019, 2023) to zmienna ta będzie mierzona na skali interwałowej – możemy określić różnicę w wieku samochodów, ale 0 na tej skali jest jedynie umowne (rozpoczyna się „nasza era”). Jeśli jednak wybierzemy przedstawienie tej informacji w latach, to możemy przyjąć, że samochód wyjeżdżający wprost z hali produkcyjnej ma 0 lat, a wyprodukowany w 2019 roku będzie miał na dzień dzisiejszy lat 4.

 

Zmienne jakościowe i ilościowe

Warto w tym miejscu krótko wspomnieć o podziale zmiennych na jakościowe i ilościowe. Do zmiennych jakościowych zaliczamy zmienne mierzone na skali nominalnej oraz porządkowej. Posiadają one określone kategorie, których podział jest wyczerpujący i rozłączny (o czym mowa była wcześniej).

Zmienne ilościowe natomiast posiadają takie właściwości, które możemy precyzyjnie zmierzyć. Skalami, które to umożliwiają są interwałowy i ilorazowy poziom pomiaru. Pracując w PS IMAGO PRO (czyli na silniku analitycznym IBM SPSS Statistics), te dwa rodzaje skal pomiarowych traktowane są jako jedna grupa poziomu pomiaru.

Analityk ma więc do wyboru trzy skale: nominalną, porządkową oraz ilościową. Ważne jest, aby poziom pomiaru był adekwatnie przypisany do każdej zmiennej, gdyż będzie to miało kluczowe znaczenie w późniejszych analizach. Każdy test statystyczny ma swoje ograniczenia i nierzadko dotyczą one właśnie sposobu mierzenia zmiennych.

 

Zmienne dyskretne i ciągłe

Innym podziałem, w odniesieniu do poziomu pomiaru, z którym można się spotkać, jest rozróżnienie zmiennych na dyskretne i ciągłe. Zmienne dyskretne to takie zmienne, które przyjmują skończoną liczbę wartości. Wartościom tym można przypisać całkowite liczby naturalne i równocześnie, między dwiema „sąsiednimi” wartościami dyskretnymi nie można znaleźć innych wartości. W praktyce, takimi zmiennymi są najczęściej te mierzone na skali nominalnej lub porządkowej – biorąc jako przykład kolor oczu, gdzie oznaczenia to: 1 - brązowe, 2 - niebieskie, 3 - inne, nie możemy logicznie przypisać obserwacji wartości np. 2,5. 

Istnieją jednak również zmienne ilościowe, które klasyfikować można jako dyskretne. Przykładem może tu być liczba dzieci w rodzinie, pasażerów na statku czy punktów na teście z pytaniami typu tak/nie. Z racji charakteru takich zmiennych, zbiór ich wartości jest skończony i nie sposób logicznie uzasadnić tu liczby innej niż całkowita.

Zmienne ciągłe mogą natomiast przyjmować dowolne wartości, czasem w ograniczonym (głównie prawami natury) przedziale np. jeśli badamy wzrost osób czy temperaturę otoczenia. Pomiędzy dwiema wartościami możemy jednak zaobserwować nieskończenie wiele innych wartości. Tu jedynym ograniczeniem jest dokładność pomiaru jakim dysponujemy.

 

Poziomy pomiaru a statystyka

Jak wspomniane było wcześniej, poziom pomiaru może stanowić pewne ograniczenie podczas wyboru wyliczanych statystyk. Przyjrzyjmy się teraz jednym z najbardziej podstawowych, jakimi są statystyki tendencji centralnej[1].

Jak można się domyślać, najwięcej ograniczeń ma skala nominalna. Możemy dla niej wyliczyć dominantę, jednak np. średnia lub mediana nie jest dostępna. Wracając do przykładu z kolorem oczu – możemy powiedzieć, która wartość była najczęściej obserwowana (dominanta/modalna), jednak z racji tego, że kategorie nie są uporządkowane, nie można wskazać ani środka przedziału (mediana) ani „przeciętnej” wartości (średnia) koloru oczu.

Jeśli zmienna mierzona jest na skali porządkowej, to oprócz dominanty, można wyliczyć także medianę. Analizując zmienną dotyczącą aktualnego etapu edukacji osób badanych, może okazać się że np. dominantą będzie etap szkoły podstawowej (najdłuższy okres nauki, więc i najwięcej dzieci), ale medianą będzie kategoria etapu szkoły średniej. Możemy więc otrzymać zarówno informację o dominującej kategorii (w kontekście liczebności) oraz tym, która kategoria stanowi środek przedziału w naszej grupie badanej. W dalszym ciągu niedostępną statystyką pozostaje średnia.

Skale ilościowe umożliwiają wyliczenie wszystkich wymienionych statystyk. Powyższe informacje podsumowane zostały w tabeli 1.

mapka

Tabela 1. Dostępność wybranych statystyk
dla poszczególnych poziomów pomiaru.

Ograniczone możliwości wyliczania statystyk przekładają się również na dostępność testów statystycznych. Znając podstawy teoretyczne poszczególnych metod analizy danych, będziemy wiedzieli, czy można je wykorzystać do posiadanego przez nas zbioru. Jeśli wiemy, że np. analiza wariancji[2] opiera się na średnich wartościach w poszczególnych grupach, to będziemy wiedzieć też, że zmienne zależne, które chcemy do takiego testu wykorzystać, muszą być mierzone na skali ilościowej.

Istnieją również oczywiście testy statystyczne przeznaczone do analizy zmiennych jakościowych. Przykładem jest tu test chi-kwadrat[3], dla którego podstawową, bazową statystyką jest liczebność w poszczególnych grupach.

 

Analizy prezentowane w tym artykule zostały zrealizowane przy pomocy PS IMAGO PRO

 

Podsumowanie

Poziom pomiaru to istotna własność każdej zmiennej, a właściwe jego przypisanie do każdej zmiennej na etapie przygotowania zbioru danych jest kluczowe, jeśli dalsze analizy mają być rzetelne i adekwatne.

Choć znajomość testów statystycznych i ich teoretycznych podstaw bardzo ułatwia analitykowi pracę, można posiłkować się również podpowiedziami programu statystycznego. Czasem wybierając zmienne do analizy, będziemy otrzymywać informację, że dany poziom pomiaru nie może być w tej procedurze wykorzystany – dlatego właśnie, tak ważne jest odpowiednie przygotowanie zbioru zawczasu.

Pracując z danymi możemy dokonywać również ich przekształceń. Jeśli chcemy podzielić nasz zbiór na pewne grupy np. na potrzeby pożądanej analizy statystycznej, możemy przekształcić np. zmienną wiek wyrażoną w latach (skala ilościowa) na określoną liczbę grup wiekowych (skala porządkowa np. 18-30, 31-50 i 51+). W szczególnych przypadkach możemy utworzyć nową zmienną porządkową na podstawie zmiennej nominalnej. Przykładem może być tu przekształcenie nazw szkół do których uczęszczają osoby badane na kategorie etapów edukacji – do grupy szkolnictwa średniego zakwalifikujemy np. XX LO, IV Technikum Gastronomiczne, a wszystkie kolejne Szkoły Podstawowe znajdą się w kategorii kształcenia podstawowego. Zazwyczaj jednak, prostsze jest „schodzenie” z bardziej precyzyjnych poziomów pomiaru na bardziej podstawowe.

Choć daje to analitykowi pewną elastyczność, zrozumienie problemu pomiaru zmiennej uchroni badacza przed takimi wpadkami jak wyliczanie średniej z województwa czy kierunku studiów i ułatwi wybór analiz w kontekście posiadanych danych.

 

 

 

[1] https://predictivesolutions.pl/dominanta-mediana-i-srednia-miary-tendencji-centralnej

[2] https://predictivesolutions.pl/jednoczynnikowa-analiza-wariancji-one-way-anova

[3] https://predictivesolutions.pl/test-niezaleznosci-chi-kwadrat-pearsona


Oceń artykuł:

Udostępnij artykuł w social mediach



Zostańmy w kontakcie!

Chcesz dostawać wiadomości o nowych wpisach na blogu i webinarach z zakresu analizy danych? Zapisz się na powiadomienia e-mail.

Ustawienia dostępności
Zwiększ wysokość linii
Zwiększ odległość między literami
Wyłącz animacje
Przewodnik czytania
Czytnik
Większy kursor