Przypadki odstające. Identyfikacja i znaczenie w analizie danych
W analizie danych istotne jest rozpoznanie nietypowych obserwacji, które znacząco różnią się od pozostałych. Takie wartości, nazywane wartościami lub przypadkami odstającymi, mogą...
W analizie danych istotne jest rozpoznanie nietypowych obserwacji, które znacząco różnią się od pozostałych. Takie wartości, nazywane wartościami lub przypadkami odstającymi, mogą...
Poziom pomiaru jest jedną z najważniejszych własności zmiennych. Warunkuje on, jakie testy statystyczne będą później w toku analizy dla badacza dostępne. Jakie jednak informacje...
Do grona popularnych testów statystycznych można zaliczyć testy chi-kwadrat Pearsona. Warto na początku zwrócić uwagę, że test ten ma więcej niż jedno zastosowanie. W tym...
Entropia jest miarą nieuporządkowania lub niepewności w rozkładzie prawdopodobieństwa.
Indeks Giniego jest miarą koncentracji rozkładu zmiennej.
Sieci neuronowe to rodzina algorytmów ciesząca się coraz większą popularnością w zadaniach z obszaru predykcji, klasyfikacji czy grupowania.
Regresja służy do przewidywania wartości zmiennej zależnej (przewidywanej) na podstawie wartości zmiennej lub zmiennych niezależnych (predyktorów).
Kurtoza i skośność to miary asymetrii opisujące takie własności jak kształt i asymetria analizowanego rozkładu. Dostarczają nam informacji, w jaki sposób wartości zmiennych...
Kwantyle wykorzystujemy do określenia pozycji danej wartości na tle innych w grupie lub populacji. Powiedzmy, że otrzymaliśmy wyniki egzaminów maturalnych z matematyki. Chcesz...
Chętnie porozmawiamy na tematy dotyczące zastosowania analizy danych w twoich działaniach.
Dysponujemy wiedzą z wielu obszarów i znamy specyfikę branż.