JuliaStatystyka

Analiza czynnikowa i analizy wielowymiarowe w środowisku Julia – segmentacja wielu zmiennych

06 - 08 maj 2024

Online

3 300,00 zł netto / osobę
Nie pasuje Ci żaden termin? Napisz do nas!
Zapisz więcej osób

Taniej w grupie

  • 3 osoby - 10% zniżki
  • 4 osoby - 15% zniżki
  • 5 osób - 20% zniżki
  • 6 osób - 25% zniżki
  • 7 osób - 30% zniżki
  • O szkoleniu

    Opanowanie metod opartych o Analizę Głównych Składowych pozwala spojrzeć na dane w nowy, uniwersalny sposób. Przeprowadzenie tego procesu osobiście jest wejściem do dosłownie wielowymiarowego świata. Metoda ta pozwoliła w XX wieku fizykom na przekroczenie granicy poznania świata kwantowego, jest również podstawą w rodzącym sie świecie big data.

    Redukcja danych i odkrywanie ukrytych zależności miedzy dużą liczbą zmiennych jest kluczowym problemem w big data. Środowisko Julia posiada bardzo wydajne biblioteki pozwalające przetwarzać wielkie macierze. Szkolenie ma na celu naukę, krok po kroku, poprzez przeprowadzenie i pokazanie całego procesu oraz jego zrozumienie i pełną interpretację wyników.

    Dla kogo jest to szkolenie?

    Analitycy, programiści i menadżerowie, odpowiedzialni za analizę i wykorzystanie w biznesie dużych zbiorów danych.

    Czego się nauczę?

    Po ukończeniu szkolenia:

    • Zrozumiesz i nauczysz się redukować i przeprowadzać segmentację danych techniką Analizy Głównych Składowych (PCA) (oraz Analizy Czynnikowej)
    • Wykorzystasz automatyczne zrównoleglenia obliczeń dużych macierzy danych
    • Poznasz Julię jako wydajne środowisko obliczeń dla Data Science
    • Nauczysz się praktycznie interpretować wyniki analizy i transformacji danych.
    • Instalacja środowiska Julia
    • Instalacja pakietów
    • Czytanie i zapis danych, wykorzystanie formatów danych adekwatnych do postaci danych roboczych
    • Transformacja danych
    • Pętle i funkcje w Julii, makra
    • “Dane rzadkie” (Sprase arrays), skuteczna metoda eliminowania zer z danych
    • Analiza zależność miedzy zmiennymi
    • Miary zależności
    • Wariancja i jej znaczenie w opisie zbiorów
    • Kowariancja a korelacja, praktyczne skutki użycia i interpretacja.
    • Skalowanie i standaryzacja, ich wpływ na interpretację wyników
    • Obliczanie macierzy korelacji i kowariancji dla dużych zbiorów danych
    • Pojęcia wartości i wektorów własnych i ich obliczanie
    • Kryteria wyboru liczby zredukowanych wymiarów
    • Wyliczanie Głównych Składowych i budowanie nowego modelu danych
    • Interpretacja modelu opisanego w układzie Głównych Składowych
    • Analiza związków statystycznych Głównych Składowych z danymi pierwotnymi
    • Interpretacja i opis danych pierwotnych przy użyciu nowego modelu
    • Analiza Głównych Składowych jest jedna z podstawowych, kanonicznych metod przekształcenia dużych ilości danych w taki sposób aby były łatwe w interpretacji a poprzez znaczne zmniejszenie ilości danych (przy zachowaniu w nich prawie pełnej informacji) jest bardzo przydatna we wszelkich procesach big data oraz tam gdzie krytycznym czynnikiem jest czas.