Kwantyle, kwartyle, percentyle (miary położenia)

Tekst przeczytasz w: 4 minuty.
Kwantyle wykorzystujemy do określenia pozycji danej wartości na tle innych w grupie lub populacji. Powiedzmy, że otrzymaliśmy wyniki egzaminów maturalnych z matematyki. Chcesz dowiedzieć się czy twój wynik jest wysoki w porównaniu do wyników pozostałych osób piszących maturę w tym samym roku, czy może zadania były wyjątkowo proste i wszystkim tak dobrze poszło?

Sprawdź również:

Rzućmy okiem na przykładowe świadectwo dojrzałości przedstawiające wyniki egzaminów maturalnych. Zaraz obok informacji o zdobytych punktach widzimy komentarz „wynik taki sam lub niższy uzyskało 96% zdających”. Ta informacja to nic innego jak wartość 96 percentyla, który podzielił populację wszystkich osób piszących maturę na dwie części. Czyli tylko 4% osób zdających maturę wypadło tak samo dobrze lub lepiej.. Zgodzimy się więc, że kwantyle mają praktyczne zastosowanie nawet w życiu codziennym, dlatego przyjrzyjmy się trochę bliżej temu zagadnieniu.

 

Kwantyle jako miary położenia

Miary położenia służą do określenia takiej wartości zmiennej, wokół której skupione są pozostałe wartości zmiennej opisanej danym rozkładem[1]. Dzielimy je na miary klasyczne oraz miary pozycyjne. W tym artykule skupimy się jednak na miarach pozycyjnych, a dokładniej kwantylach.

Chcesz wiedzieć więcej?

Zapraszamy na szkolenie ST 1. Podstawy statystyki dla każdego

 

Czym są kwantyle i jakie są ich rodzaje?

Kwantyle to wartości cechy danej zbiorowości statystycznej, które umożliwiają jej podział na określone części w odpowiednich proporcjach. W praktyce do najczęściej stosowanych kwantyli zaliczamy: kwartyle, decyle i percentyle.

Jeśli chodzi o kwartyle to wyróżniamy 3 dzielące cechy badanej zbiorowości na 4 równoliczne grupy. Każdy z tych trzech kwartyli dzieli cechy tej zbiorowości na 2 grupy w odpowiednich proporcjach. Należy jednak pamiętać o wcześniejszym uporządkowaniu malejąco wartości cech zbiorowości.

  • Kwartyl pierwszy (dolny) Q1 który dokonuje podziału danej zbiorowości na 2 grupy, przy czym pierwszą grupę stanowi 25% obserwacji przyjmujących wartość mniejszą lub równą wartości kwartyla pierwszego. Pozostałe 75% przyjmuje wartości większe lub równe wartości kwartyla.
  • Kwartyl drugi  jest odpowiednikiem mediany, czyli dzieli badaną zbiorowość tak, że 50% obserwacji przyjmuje wartości mniejsze lub równe medianie oraz 50 % obserwacji przyjmuje wartości większe lub równe medianie.
  • Kwartyl trzeci (górny)  podzieli zbiorowość statystyczną na części tak, że 75% obserwacji przyjmuje wartości mniejsze lub równe kwartylowi trzeciemu i 25% obserwacji – większe lub równe.

Przyjrzyjmy się krótkiemu przykładowi interpretacji danych kwartyli.

Pracownik działu pewnej firmy zarabia 5300 zł brutto miesięcznie. Dokonując krótkiej analizy rozkładu wynagrodzeń pracowników tego działu w PS IMAGO PRO otrzymano następujące wartości kwartyli (tab1).

Percentyle zmiennej Wynagrodzenie

Tabela 1.
Percentyle zmiennej Wynagrodzenie

Warto zauważyć, że w PS IMAGO PRO kwartyle 1,2 oraz 3 przedstawione są w postaci 25, 50 oraz 75 percentyla.

Na podstawie wartości kwartyli np.  (inaczej 25 percentyl) można wnioskować, że 75% pracowników tego działu może pochwalić się wynagrodzeniem brutto takim samym lub wyższym niż wspomniany na początku pracownik działu. Analogicznie interpretacja  będzie brzmiała następująco: 25% pracowników zarabia 11,3 tys. brutto lub więcej w ciągu miesiąca.

Dodatkowo wykorzystując wartości kwartyli możemy wyznaczyć tzw. rozstęp międzykwartylowy czyli różnicę pomiędzy trzecim a pierwszym kwartylem, która wyznacza 50% obserwacji centralnych obserwacji.

Decyle to wartości dzielące zbiorowość na 10 części. Wszystkich decyli jest więc 9, przy czym warto pamiętać że decyl 5 jest równy medianie.

Np. decyl 4 podzieli nam badaną zbiorowość w taki sposób, że 40% jednostek przyjmie wartości mniejsze lub równe wartości decyla, natomiast 60% jednostek będzie miała wartości równe lub wyższe.

Percentyle (centyle) – jest ich 99. Wartości te dzielą zbiorowość statystyczną na 100 części. Percentyl 50 jest równy medianie.

Np. 47 percentyl dzieli analizowaną zbiorowość w taki sposób, że 47% przypadków przyjmuje wartości mniejsze lub równe, a 53% jednostek przyjmuje wartości równe lub wyższe od tego percentyla.

 

Analizy prezentowane w tym artykule zostały zrealizowane przy pomocy PS IMAGO PRO

 

Kiedy warto wykorzystać kwantyle?

Analizując strukturę rozkładu danej zmiennej czasami można natrafić na sytuację, w której średnia nie będzie dobrze reprezentować wartości typowej dla danego rozkładu np. z powodu występowania skrajnie ekstremalnych wartości, otwartych przedziałów kategorii czy też w przypadku gdy rozkłady charakteryzują się silną asymetrią. W takich sytuacjach szczególnie przydatne w analizie struktury rozkładu danej zmiennej będą właśnie wartości poszczególnych kwartyli.

 

Siatka centylowa rozwoju dziecka

Na zakończenie ciekawostka odnośnie praktycznego wykorzystania centyli. Poza tym, że dzięki kwantylom możemy stwierdzić jaki procent maturzystów poradziło sobie lepiej od nas na egzaminach miarę tę stosujemy również do skonstruowania tzw. siatki centylowej rozwoju dziecka, która na co dzień wykorzystywana jest przez lekarzy, pielęgniarki a nawet rodziców. Jest to wizualizacja wartości centyli ze względu na wiek dziecka i służy do kontrolowania i oceny indywidualnego rozwoju dziecka przez porównanie jego cech z tzw. normą rozwojową populacji zdrowych dzieci[2]. Najczęściej siatka przedstawia centyle: 3, 10, 25, 50, 75, 90, 97 lub 5, 10, 25, 50, 75, 90 i 95, przy czym centyle 3 i 97 oraz 5 i 95 wyznaczają tzw. granicę normy. Na takich siatkach centylowych najczęściej przedstawiane są wysokość i masa ciała dziecka.

 

Jak czytać siatkę centylową?

Poniżej siatka centylowa wysokości ciała chłopców. Poszczególne linie centylowe określają procent dzieci, które w każdej grupie wieku znajdują się poniżej ich poziomu. Np. jeżeli wysokość ciała chłopca w danym wieku znajdzie się na linii 25 centyla oznacza to że 25% jego rówieśników tego chłopca jest od niego niższa lub tego samego wzrostu. W ten sposób wyznaczamy kanały rozwojowe dzieci i możemy monitorować indywidualną ścieżkę rozwoju dziecka.

Siatka centylowa wysokości ciała chłopców

Rysunek 1. Siatka centylowa wysokości ciała chłopców

 

[1] Sobczyk M. Statystyka, Warszawa, PWN 2007.

[2] Malinowski A. Auksologia. Rozwój osobniczy człowieka w ujęciu biomedycznym, Zielona Góra, Uniwersytet Zielonogórski, 2007.


Oceń artykuł:

Udostępnij artykuł w social mediach



Zostańmy w kontakcie!

Chcesz dostawać wiadomości o nowych wpisach na blogu i webinarach z zakresu analizy danych? Zapisz się na powiadomienia e-mail.

Ustawienia dostępności
Zwiększ wysokość linii
Zwiększ odległość między literami
Wyłącz animacje
Przewodnik czytania
Czytnik
Większy kursor