Autorzy

Strona główna Artykuły - taksonomia Autorzy Rafał Waśko

Blog

Analiza regresji liniowej

Analiza regresji liniowej

Główną ideą regresji jest przewidywanie wartości zmiennej zależnej (inaczej też określanej jako przewidywana, wyjaśniana) na podstawie jednej lub większej liczby zmiennych niezależnych (tzw. predyktorów, zmiennych wyjaśniających).

Przeczytaj więcej
Automatyczne przygotowywanie danych do analizy

Automatyczne przygotowywanie danych do analizy

Przygotowanie danych odgrywa kluczową rolę w analizie danych i procesach uczenia maszynowego. Jego znaczenie wynika z kilku ważnych aspektów, które wpływają na jakość i wiarygodność wyników. Dane o wysokiej jakości mają wpływ na dokładniejsze i bardziej wiarygodne modele statystyczne. Surowe, niepr…

Przeczytaj więcej
Braki danych w ilościowej analizie danych – czym są i jak sobie z nimi radzić?

Braki danych w ilościowej analizie danych – czym są i jak sobie z nimi radzić?

Braki w kontekście analizy danych oznaczają sytuacje, gdy w zbiorze danych nie ma wartości dla niektórych zmiennych lub obserwacji. Innymi słowy, są to miejsca, w których oczekiwano liczby, tekstu, czy innej formy danych, ale z różnych przyczyn się tam nie znalazły. Braki danych mogą mieć różne for…

Przeczytaj więcej
Co to znaczy dobrze, a co źle, czyli alerty w dashboardach

Co to znaczy dobrze, a co źle, czyli alerty w dashboardach

Dashboardy są jednym z rodzajów raportowania, który pozwala analitykowi na przekazanie informacji w zwięzłej formie.

Przeczytaj więcej
Customer Effort Score (CES)

Customer Effort Score (CES)

Customer Effort Score (CES) jest obok Net Promoter Score (NPS) i Customer Satisfaction (CSAT) jednym głównych wskaźników związanych z satysfakcją klienta.

Przeczytaj więcej
Dashboard plan kostki

Dashboard plan kostki

Jedną z wizualizacji, która pozwala na przedstawienie procentu realizacji zakładanych planów jest wykres Procent Planu Kostki.

Przeczytaj więcej
Jednoczynnikowa analiza wariancji (one-way ANOVA)

Jednoczynnikowa analiza wariancji (one-way ANOVA)

Jednoczynnikowa analiza wariancji (ang.: one-way ANOVA, Analysis Of Variance) jest testem parametrycznym, który stosujemy do zweryfikowania, czy istnieją istotne statystycznie różnice w średnich między przynajmniej trzema grupami.

Przeczytaj więcej
Kartogram - w poszukiwaniu wzorców przestrzennych

Kartogram - w poszukiwaniu wzorców przestrzennych

Rozwój oprogramowania do analizy statystycznej pozwala analitykowi na przygotowanie wielu ciekawych form wizualizacji danych.

Przeczytaj więcej
Kategoryzacja pytań otwartych – jak przyspieszyć ten proces?

Kategoryzacja pytań otwartych – jak przyspieszyć ten proces?

Jednym z rodzajów pytań wykorzystywanych w badaniach ankietowych są pytania otwarte. Kategoryzacja zebranych dzięki nim odpowiedzi jest czasochłonna i żmudna, szczególnie jeśli są to długie wypowiedzi.

Przeczytaj więcej
Mediana

Mediana

Mediana jest statystyką, którą zaliczamy do miar tendencji centralnych. Jest jedną z najpopularniejszych statystyk opisowych obok średniej arytmetycznej. Dla młodych adeptów sztuki analitycznej jest to statystyka, z którą zapoznają się jako jedną z pierwszych. Warto dodać, że oprócz prostej interpr…

Przeczytaj więcej
Miary rozproszenia

Miary rozproszenia

Jak sprawdzić, czy wyliczona średnia lub mediana daje nam wiarygodny obraz badanej grupy?

Przeczytaj więcej
Moc testu

Moc testu

Moc testu to prawdopodobieństwo wykrycia istotnego statystycznie efektu, gdy faktycznie taki w badanej populacji występuje.

Przeczytaj więcej
Net Promoter Score (NPS)

Net Promoter Score (NPS)

Badania satysfakcji i lojalności klienta są obecnie nieodłącznym elementem biznesu nastawianego na rozwój i budowanie przewagi nad konkurencją. Obecnie standardem w tym zakresie jest wskaźnik NPS, który jest skrótem od Net Promoter Score.

Przeczytaj więcej
Ogólne modele liniowe i uogólnione modele liniowe - różnice oraz podobieństwa

Ogólne modele liniowe i uogólnione modele liniowe - różnice oraz podobieństwa

W analizie danych, stosowanie ogólnych modeli liniowych jest powszechne ze względu na ich prostotę i łatwość w interpretacji uzyskanych wyników. Jednakże zdarza się, że analityk napotyka sytuacje, w których założenia klasycznych modeli liniowych są trudne lub niemożliwe do spełnienia. Może to wynik…

Przeczytaj więcej
Przypadki odstające. Identyfikacja i znaczenie w analizie danych

Przypadki odstające. Identyfikacja i znaczenie w analizie danych

W analizie danych istotne jest rozpoznanie nietypowych obserwacji, które znacząco różnią się od pozostałych. Takie wartości, nazywane wartościami lub przypadkami odstającymi, mogą wpływać na wyniki analizy statystycznej i prowadzić do błędnych wniosków. W tym materiale przyjrzymy się czym są przypa…

Przeczytaj więcej
Reguła trzech sigm

Reguła trzech sigm

Reguła trzech sigm jest ważnym narzędziem w statystyce i zarządzaniu jakością. W kontekście analizy danych, pozwala na identyfikację punktów odstających, które znacznie różnią się od reszty danych. Wykorzystanie reguły trzech sigm w kontroli jakości pozwala również na ujawnienie anomalii, co umożli…

Przeczytaj więcej
Segmentacja: od grupowania do klasyfikacji

Segmentacja: od grupowania do klasyfikacji

Segmentacja jest kluczowym procesem w analizie danych, polegającym na podziale zbioru danych na stosunkowo jednorodne grupy na podstawie określonych kryteriów. Celem segmentacji jest identyfikacja ukrytych wzorców, różnic i podobieństw między obiektami w zbiorze danych, co umożliwia bardziej precyz…

Przeczytaj więcej
Skąd brać dane? Plusy i minusy analizy danych zastanych

Skąd brać dane? Plusy i minusy analizy danych zastanych

Czym są dane? Do czego są potrzebne? Czy można je podzielić według konkretnych kryteriów ? Czy dane pochodzą tylko z badań?

Przeczytaj więcej
Tabele dla pytań mierzonych na tej samej skali

Tabele dla pytań mierzonych na tej samej skali

W badaniach ankietowych często wykorzystuje się pytania, w których respondenci mają za zadanie ocenić na tej samej skali różnego rodzaju elementy.

Przeczytaj więcej
Test niezależności chi-kwadrat Pearsona

Test niezależności chi-kwadrat Pearsona

Test niezależności chi-kwadrat jest jednym najpopularniejszych testów statystycznych. Stosuje się go w celu sprawdzenia, czy między dwiema zmiennymi jakościowymi występuje istotna statystycznie zależność.

Przeczytaj więcej
Test zgodności chi-kwadrat Pearsona

Test zgodności chi-kwadrat Pearsona

Do grona popularnych testów statystycznych można zaliczyć testy chi-kwadrat Pearsona. Warto na początku zwrócić uwagę, że test ten ma więcej niż jedno zastosowanie. W tym materiale omówię najważniejsze różnice między testami oraz przybliżę najważniejsze zagadnienia związane z testem zgodności chi-k…

Przeczytaj więcej
Testy parametryczne a nieparametryczne. Jaki test wybrać do analizy?

Testy parametryczne a nieparametryczne. Jaki test wybrać do analizy?

Analiza statystyczna jest nieodłącznym elementem badań naukowych i pracy z danymi. Aby wyciągnąć prawidłowe wnioski, niezbędne jest zastosowanie odpowiednich testów statystycznych. Analityk często staje przed wyborem, który test w danej sytuacji wybrać. Jest to ważne, ponieważ niewłaściwe dobranie …

Przeczytaj więcej
Testy t Studenta

Testy t Studenta

Grupa testów t Studenta służy do porównania ze sobą dwóch grup wyników, zmierzonych za pomocą średniej arytmetycznej.

Przeczytaj więcej
Twój wykres szeregu może powiedzieć więcej

Twój wykres szeregu może powiedzieć więcej

Wykres szeregu jest rodzajem wykresu liniowego lub warstwowego najczęściej wykorzystywanym do prezentacji zmian w czasie.

Przeczytaj więcej
Wykres hierarchiczny

Wykres hierarchiczny

Wykres hierarchiczny można również znaleźć pod nazwą Sunburst chart (co możemy tłumaczyć jako rozbłysk Słońca) lub jako wykres słonecznikowy.

Przeczytaj więcej
Wykres kaskadowy - co ma wodospad do wizualizacji danych?

Wykres kaskadowy - co ma wodospad do wizualizacji danych?

Wykres wodospadowy inaczej nazywany wykresem kaskadowym, osobom spoza branży finansowej może niewiele mówić.

Przeczytaj więcej
Wykres kolumnowy, słupkowy i histogram

Wykres kolumnowy, słupkowy i histogram

Wykresy kolumnowe i słupkowe to od dawna jedne z najpopularniejszych sposobów wizualizacji danych. Zanim zdecydujemy się na użycie któregoś z nich, warto przyjrzeć im się bliżej.

Przeczytaj więcej
Wykres rozrzutu

Wykres rozrzutu

Wykres rozrzutu (inaczej też nazywany punktowy lub rozproszenia, ang. scatterplot) jest to wykres z dwiema prostopadle ułożonymi osiami, na których są prezentowane dwie zmienne.

Przeczytaj więcej
Wykres wiolinowy

Wykres wiolinowy

Podstawowa forma wykresu wiolinowego bazuje na symetrycznym wykresie gęstości, pokazanym względem pionowej osi. Wizualizacja pokazuje rozkład dla całej zmiennej.

Przeczytaj więcej
Ustawienia dostępności
Wysokość linii
Odległość między literami
Wyłącz animacje
Przewodnik czytania
Czytnik
Wyłącz obrazki
Skup się na zawartości
Większy kursor
Skróty klawiszowe