Blog

Strona główna Blog
Ogólne modele liniowe i uogólnione modele liniowe - różnice oraz podobieństwa

Ogólne modele liniowe i uogólnione modele liniowe - różnice oraz podobieństwa

W analizie danych, stosowanie ogólnych modeli liniowych jest powszechne ze względu na ich prostotę i łatwość w interpretacji uzyskanych wyników. Jednakże zdarza się, że analityk napotyka sytuacje, w których założenia klasycznych modeli liniowych są trudne lub niemożliwe do spełnienia. Może to wynik…

Przeczytaj więcej
Wnioskowanie bayesowskie

Wnioskowanie bayesowskie

Wnioskowanie bayesowskie to metoda wnioskowania statystycznego. Została tak nazwana na cześć Thomasa Bayesa, brytyjskiego matematyka i pastora, który po raz pierwszy sformułował teorię prawdopodobieństwa bayesowskiego w XVIII wieku. To metoda analizy danych, która pozwala na określenie prawdopodobi…

Przeczytaj więcej
Braki danych w ilościowej analizie danych – czym są i jak sobie z nimi radzić?

Braki danych w ilościowej analizie danych – czym są i jak sobie z nimi radzić?

Braki w kontekście analizy danych oznaczają sytuacje, gdy w zbiorze danych nie ma wartości dla niektórych zmiennych lub obserwacji. Innymi słowy, są to miejsca, w których oczekiwano liczby, tekstu, czy innej formy danych, ale z różnych przyczyn się tam nie znalazły. Braki danych mogą mieć różne for…

Przeczytaj więcej
Piramida populacyjna

Piramida populacyjna

Poszukując najlepszej metody wizualizacji posiadanych danych, natrafić można na imponująco szeroką paletę różnego rodzaju wykresów – od prostych, podstawowych takich jak wykres rozrzutu, do bardzo zaawansowanych jak diagram Sankeya. Niektóre z nich zostały jednak stworzone z myślą o specyficznym ro…

Przeczytaj więcej
Reguła trzech sigm

Reguła trzech sigm

Reguła trzech sigm jest ważnym narzędziem w statystyce i zarządzaniu jakością. W kontekście analizy danych, pozwala na identyfikację punktów odstających, które znacznie różnią się od reszty danych. Wykorzystanie reguły trzech sigm w kontroli jakości pozwala również na ujawnienie anomalii, co umożli…

Przeczytaj więcej
Segmentacja: od grupowania do klasyfikacji

Segmentacja: od grupowania do klasyfikacji

Segmentacja jest kluczowym procesem w analizie danych, polegającym na podziale zbioru danych na stosunkowo jednorodne grupy na podstawie określonych kryteriów. Celem segmentacji jest identyfikacja ukrytych wzorców, różnic i podobieństw między obiektami w zbiorze danych, co umożliwia bardziej precyz…

Przeczytaj więcej
Rekodowanie zmiennych ilościowych na jakościowe – techniki i ich praktyczne zastosowanie

Rekodowanie zmiennych ilościowych na jakościowe – techniki i ich praktyczne zastosowanie

Analizując dane bierzemy pod uwagę zarówno informacje ilościowe (takie jak wynagrodzenie, wiek, liczba zamówionych produktów), jak i jakościowe (np. płeć, wykształcenie, poziom zadowolenia z obsługi). Aby ułatwić pracę z danymi lub dostosować je do konkretnej analizy statystycznej, niekiedy dane li…

Przeczytaj więcej
Wartość odstająca czy anomalia? Wykrywanie obserwacji nietypowych

Wartość odstająca czy anomalia? Wykrywanie obserwacji nietypowych

Czy jedno nietypowe zdarzenie może niepokoić? Na podstawie jednego odstępstwa od normy może zapalić się czerwona lampka? Oczywiście! W wielu branżach i biznesach anomalia to znak, na który trzeba reagować szybko i sprawnie, aby zapobiec konsekwencjom. Jak więc rozpoznać anomalię i jak nie pomylić c…

Przeczytaj więcej
Wnioskowanie statystyczne

Wnioskowanie statystyczne

Wnioskowanie statystyczne jest działem statystyki, dzięki któremu możliwe staje się opisywanie, analizowanie i wnioskowanie na temat całej populacji na podstawie badanej próby.

Przeczytaj więcej
Przypadki odstające. Identyfikacja i znaczenie w analizie danych

Przypadki odstające. Identyfikacja i znaczenie w analizie danych

W analizie danych istotne jest rozpoznanie nietypowych obserwacji, które znacząco różnią się od pozostałych. Takie wartości, nazywane wartościami lub przypadkami odstającymi, mogą wpływać na wyniki analizy statystycznej i prowadzić do błędnych wniosków. W tym materiale przyjrzymy się czym są przypa…

Przeczytaj więcej
Poziomy pomiaru

Poziomy pomiaru

Poziom pomiaru jest jedną z najważniejszych własności zmiennych. Warunkuje on, jakie testy statystyczne będą później w toku analizy dla badacza dostępne. Jakie jednak informacje konkretnie nam przekazuje? Poziom pomiaru to wzorzec dokonywania pomiaru, który umożliwia określenie i ocenę stopnia lub …

Przeczytaj więcej
Test zgodności chi-kwadrat Pearsona

Test zgodności chi-kwadrat Pearsona

Do grona popularnych testów statystycznych można zaliczyć testy chi-kwadrat Pearsona. Warto na początku zwrócić uwagę, że test ten ma więcej niż jedno zastosowanie. W tym materiale omówię najważniejsze różnice między testami oraz przybliżę najważniejsze zagadnienia związane z testem zgodności chi-k…

Przeczytaj więcej
Entropia

Entropia

Entropia jest miarą nieuporządkowania lub niepewności w rozkładzie prawdopodobieństwa.

Przeczytaj więcej
Indeks Giniego

Indeks Giniego

Indeks Giniego jest miarą koncentracji rozkładu zmiennej.

Przeczytaj więcej
Sieci neuronowe

Sieci neuronowe

Sieci neuronowe to rodzina algorytmów ciesząca się coraz większą popularnością w zadaniach z obszaru predykcji, klasyfikacji czy grupowania.

Przeczytaj więcej
Regresja logistyczna

Regresja logistyczna

Regresja służy do przewidywania wartości zmiennej zależnej (przewidywanej) na podstawie wartości zmiennej lub zmiennych niezależnych (predyktorów).

Przeczytaj więcej
Skośność i kurtoza

Skośność i kurtoza

Kurtoza i skośność to miary asymetrii opisujące takie własności jak kształt i asymetria analizowanego rozkładu. Dostarczają nam informacji, w jaki sposób wartości zmiennych odchylają się porównując do wartości średniej.

Przeczytaj więcej
Kwantyle, kwartyle, percentyle (miary położenia)

Kwantyle, kwartyle, percentyle (miary położenia)

Kwantyle wykorzystujemy do określenia pozycji danej wartości na tle innych w grupie lub populacji. Powiedzmy, że otrzymaliśmy wyniki egzaminów maturalnych z matematyki. Chcesz dowiedzieć się czy twój wynik jest wysoki w porównaniu do wyników pozostałych osób piszących maturę w tym samym roku, czy m…

Przeczytaj więcej
Test niezależności chi-kwadrat Pearsona

Test niezależności chi-kwadrat Pearsona

Test niezależności chi-kwadrat jest jednym najpopularniejszych testów statystycznych. Stosuje się go w celu sprawdzenia, czy między dwiema zmiennymi jakościowymi występuje istotna statystycznie zależność.

Przeczytaj więcej
Testy t Studenta

Testy t Studenta

Grupa testów t Studenta służy do porównania ze sobą dwóch grup wyników, zmierzonych za pomocą średniej arytmetycznej.

Przeczytaj więcej
Od wariancji do metody najmniejszych kwadratów (MNK)

Od wariancji do metody najmniejszych kwadratów (MNK)

Średnia jest jedną z najbardziej popularnych i najczęściej stosowanych miar statystycznych. Sama w sobie nie jest wyczerpującym wskaźnikiem i pozwala jedynie na określenie tendencji centralnej analizowanej zmiennej.

Przeczytaj więcej
Moc testu

Moc testu

Moc testu to prawdopodobieństwo wykrycia istotnego statystycznie efektu, gdy faktycznie taki w badanej populacji występuje.

Przeczytaj więcej
Customer Satisfaction Index (CSI)

Customer Satisfaction Index (CSI)

Customer Satisfaction Index (CSI), czyli wskaźnik satysfakcji konsumenta, jest metodą wykorzystywaną w marketingu do oceny zadowolenia klienta z produktów lub usług dostarczanych przez firmę.

Przeczytaj więcej
Customer Effort Score (CES)

Customer Effort Score (CES)

Customer Effort Score (CES) jest obok Net Promoter Score (NPS) i Customer Satisfaction (CSAT) jednym głównych wskaźników związanych z satysfakcją klienta.

Przeczytaj więcej
Analiza czynnikowa

Analiza czynnikowa

Celem analizy czynnikowej jest wyjaśnienie jak największej części zmienności przy pomocy jak najmniejszej liczby zmiennych.

Przeczytaj więcej
Analiza regresji liniowej

Analiza regresji liniowej

Główną ideą regresji jest przewidywanie wartości zmiennej zależnej (inaczej też określanej jako przewidywana, wyjaśniana) na podstawie jednej lub większej liczby zmiennych niezależnych (tzw. predyktorów, zmiennych wyjaśniających).

Przeczytaj więcej
Błędy I i II rodzaju

Błędy I i II rodzaju

Sprawdzając postawione hipotezy badawcze, w kategoriach statystycznych odnosimy się do tzw. testowania hipotez statystycznych. Wyjściową hipotezą jest hipoteza zerowa, która zazwyczaj zakłada brak różnic np. między grupami, pomiarami, rozkładami.

Przeczytaj więcej
Istotność statystyczna

Istotność statystyczna

Poziom istotności statystycznej jest jednym z najważniejszych aspektów analizy danych, wykorzystywanym przy większości stosowanych testów. Poziom istotności to punkt odcięcia określający prawdopodobieństwo, że otrzymany wynik wystąpił w próbie przypadkowo. Mówiąc bardziej statystycznie – że błędnie…

Przeczytaj więcej
Stosunek korelacyjny eta

Stosunek korelacyjny eta

Stosunek korelacyjny eta jest jedną z miar zależności stosowaną w statystyce do analizy korelacji między dwoma zmiennymi. Wykorzystuje się go, gdy badany związek występuje między zmienną nominalną a interwałową lub ilorazową. Współczynnik eta pozwala więc na zbadanie tego, jak np. dzień tygodnia ko…

Przeczytaj więcej
Net Promoter Score (NPS)

Net Promoter Score (NPS)

Badania satysfakcji i lojalności klienta są obecnie nieodłącznym elementem biznesu nastawianego na rozwój i budowanie przewagi nad konkurencją. Obecnie standardem w tym zakresie jest wskaźnik NPS, który jest skrótem od Net Promoter Score.

Przeczytaj więcej
Jednoczynnikowa analiza wariancji (one-way ANOVA)

Jednoczynnikowa analiza wariancji (one-way ANOVA)

Jednoczynnikowa analiza wariancji (ang.: one-way ANOVA, Analysis Of Variance) jest testem parametrycznym, który stosujemy do zweryfikowania, czy istnieją istotne statystycznie różnice w średnich między przynajmniej trzema grupami.

Przeczytaj więcej
Korelacje – przegląd współczynników

Korelacje – przegląd współczynników

Analiza korelacji pozwala na zmierzenie siły związku między dwiema zmiennymi. W tym artykule przedstawione zostaną najbardziej podstawowe współczynniki korelacji. Istnieje wiele różnych miar zależności, również takich, które nie zostały tu opisane. Dokonanie wyboru między nimi zależy przede wszystk…

Przeczytaj więcej
Wykres kolumnowy, słupkowy i histogram

Wykres kolumnowy, słupkowy i histogram

Wykresy kolumnowe i słupkowe to od dawna jedne z najpopularniejszych sposobów wizualizacji danych. Zanim zdecydujemy się na użycie któregoś z nich, warto przyjrzeć im się bliżej.

Przeczytaj więcej
Współczynnik korelacji r-Pearsona

Współczynnik korelacji r-Pearsona

Współczynnik korelacji r-Pearsona pozwala na określenie, czy istnieje związek liniowy między dwoma zmiennymi – jeśli tak, to pozwala określić jaka jest jego siła oraz jaki ma on charakter tj. czy jest dodatni (korelacja pozytywna) czy ujemny (korelacja negatywna).

Przeczytaj więcej
Miary rozproszenia

Miary rozproszenia

Jak sprawdzić, czy wyliczona średnia lub mediana daje nam wiarygodny obraz badanej grupy?

Przeczytaj więcej

Zainteresowaliśmy Cię?

Chętnie porozmawiamy na tematy dotyczące zastosowania analizy danych w twoich działaniach.
Dysponujemy wiedzą z wielu obszarów i znamy specyfikę branż.

Grzegorz  Kamiński

Grzegorz Kamiński

Dyrektor, Analityczne rozwiązania biznesowe

501076035
Ustawienia dostępności
Wysokość linii
Odległość między literami
Wyłącz animacje
Przewodnik czytania
Czytnik
Wyłącz obrazki
Skup się na zawartości
Większy kursor
Skróty klawiszowe