Analiza danych

Artykuły

Indeks Giniego

Indeks Giniego

Indeks Giniego jest miarą koncentracji rozkładu zmiennej.
Entropia

Entropia

Entropia jest miarą nieuporządkowania lub niepewności w rozkładzie prawdopodobieństwa. Pojęcie to z…
Test zgodności chi-kwadrat Pearsona

Test zgodności chi-kwadrat Pearsona

Do grona popularnych testów statystycznych można zaliczyć testy chi-kwadrat Pearsona. Warto na pocz…
Poziomy pomiaru

Poziomy pomiaru

Poziom pomiaru jest jedną z najważniejszych własności zmiennych. Warunkuje on, jakie testy statysty…
Przypadki odstające. Identyfikacja i znaczenie w analizie danych

Przypadki odstające. Identyfikacja i znaczenie w analizie danych

W analizie danych istotne jest rozpoznanie nietypowych obserwacji, które znacząco różnią się od poz…
Wnioskowanie statystyczne

Wnioskowanie statystyczne

Wnioskowanie statystyczne jest działem statystyki, dzięki któremu możliwe staje się opisywanie, ana…
Wartość odstająca czy anomalia? Wykrywanie obserwacji nietypowych

Wartość odstająca czy anomalia? Wykrywanie obserwacji nietypowych

Czy jedno nietypowe zdarzenie może niepokoić? Na podstawie jednego odstępstwa od normy może zapalić…
Rekodowanie zmiennych ilościowych na jakościowe – techniki i ich praktyczne zastosowanie

Rekodowanie zmiennych ilościowych na jakościowe – techniki i ich praktyczne zastosowanie

Analizując dane bierzemy pod uwagę zarówno informacje ilościowe (takie jak wynagrodzenie, wiek, lic…

Automatyczna rekategoryzacja zmiennych jakościowych z modułem Data Preparation

Często podczas eksploracyjnej analizy danych poszukujemy optymalnej kategoryzacji predyktorów w cel…
Segmentacja: od grupowania do klasyfikacji

Segmentacja: od grupowania do klasyfikacji

Segmentacja jest kluczowym procesem w analizie danych, polegającym na podziale zbioru danych na sto…
Reguła trzech sigm

Reguła trzech sigm

Reguła trzech sigm jest ważnym narzędziem w statystyce i zarządzaniu jakością. W kontekście analizy…
Piramida populacyjna

Piramida populacyjna

Poszukując najlepszej metody wizualizacji posiadanych danych, natrafić można na imponująco szeroką …
Braki danych w ilościowej analizie danych – czym są i jak sobie z nimi radzić?

Braki danych w ilościowej analizie danych – czym są i jak sobie z nimi radzić?

Braki w kontekście analizy danych oznaczają sytuacje, gdy w zbiorze danych nie ma wartości dla niek…
Wnioskowanie bayesowskie

Wnioskowanie bayesowskie

Wnioskowanie bayesowskie to metoda wnioskowania statystycznego. Została tak nazwana na cześć Thomas…
Ogólne modele liniowe i uogólnione modele liniowe - różnice oraz podobieństwa

Ogólne modele liniowe i uogólnione modele liniowe - różnice oraz podobieństwa

W analizie danych, stosowanie ogólnych modeli liniowych jest powszechne ze względu na ich prostotę …
Metaanaliza jako narzędzie analityczne

Metaanaliza jako narzędzie analityczne

W dzisiejszym świecie naukowym i badawczym analitycy często napotykają problem analizy dużych ilośc…
Testy parametryczne a nieparametryczne. Jaki test wybrać do analizy?

Testy parametryczne a nieparametryczne. Jaki test wybrać do analizy?

Analiza statystyczna jest nieodłącznym elementem badań naukowych i pracy z danymi. Aby wyciągnąć pr…
Predykcyjne AI vs generatywne AI – charakterystyka, różnice

Predykcyjne AI vs generatywne AI – charakterystyka, różnice

Sztuczna inteligencja (ang. artificial intelligence, AI) to jedno z najbardziej ekscytujących i dyn…
Mediana

Mediana

Mediana jest statystyką, którą zaliczamy do miar tendencji centralnych. Jest jedną z najpopularniej…
Współczynnik determinacji R²: co to jest i jak go interpretować?

Współczynnik determinacji R²: co to jest i jak go interpretować?

Współczynnik determinacji, oznaczany jako R² (R-kwadrat), jest jednym z najczęściej używanych narzę…
Automatyczne przygotowywanie danych do analizy

Automatyczne przygotowywanie danych do analizy

Przygotowanie danych odgrywa kluczową rolę w analizie danych i procesach uczenia maszynowego. Jego …

Auto Klasyfikacja – automatyczny wybór modelu do danych w PS CLEMENTINE PRO

Podczas pracy z danymi analityk często staje przed wyzwaniem wyboru odpowiednich testów statystyczn…
Automatyczne przygotowywanie danych do analizy, cz. II

Automatyczne przygotowywanie danych do analizy, cz. II

Przygotowanie danych do analizy, jak już wielokrotnie było powtarzane na tym blogu, jest kluczowym …

Algorytmy indukcji reguł – odkrywanie wzorców w danych

Indukcja reguł jest jedną z kluczowych metod w dziedzinie sztucznej inteligencji i uczenia maszynow…

Analiza koszykowa: Zastosowanie i charakterystyka

Analiza koszykowa to popularna technika eksploracji danych, wykorzystywana przede wszystkim pod kąt…

Indukcja reguł sekwencyjnych

Indukcja reguł sekwencyjnych to zaawansowana technika eksploracji danych, która umożliwia odkrywani…
Ustawienia dostępności
Wysokość linii
Odległość między literami
Wyłącz animacje
Przewodnik czytania
Czytnik
Wyłącz obrazki
Skup się na zawartości
Większy kursor
Skróty klawiszowe