Data ScienceScala

Data Science ze Scala

03 - 05 cze 2024

Online

3 600,00 zł netto / osobę
Nie pasuje Ci żaden termin? Napisz do nas!
Zapisz więcej osób

Taniej w grupie

  • 3 osoby - 10% zniżki
  • 4 osoby - 15% zniżki
  • 5 osób - 20% zniżki
  • 6 osób - 25% zniżki
  • 7 osób - 30% zniżki
  • O szkoleniu

    Data Science z Scala to pierwsze z dwóch szkoleń ścieżki Scala dla Data Scientist. Naładowane szeregiem przykładów na ciekawych zbiorach danych dostarcza niezbędnej wiedzy i umiejętności dla każdego Data Scientist. Szkolenie porusza tematy związane z pozyskiwaniem, przechowywaniem, manipulacją, przetwarzaniem i wizualizacją danych w Scala.

    Celem szkolenia jest dostarczenie Data Scientist niezbędnej wiedzy potrzebnej do stworzenia skalowalnej architektury na potrzeby przetwarzania i modelowania danych. Praktyczny wymiar szkolenia pozwoli uczestnikom zdobyć szereg umiejętności i zwiększyć produktywność podczas tworzenia produktów data science.

    Dla kogo jest to szkolenie?

    • Data Scientist
    • Data Engineer
    • Programista Java

    Czego się nauczę?

    Po ukończeniu szkolenia uczestnik będzie potrafił:

    • Przenieść dane z plików płaskich i web API i przetworzyć je w bazach SQL i NoSQL
    • Projektować skalowalną architekturę dla Data Science
    • Przetwarzać równolegle dane minimalizując nakłady zachowując skalowalność
    • Łaczyć technologie Scala z Akka oraz Apache Spark
    • Tworzyć interaktywne wizualizacji
    • Najważniejsze aspekty Data Science
    • Języki programowania i oprogramowanie
    • Instalacja i konfiguracja Scala
    • Kiedy wykorzystać środowisko Scala
    • Literatura i wskazówki
    • Instalacja Breeze
    • Podstawowe typy danych
    • Dokumentacja i pomoc
    • Podstawowe operacje na danych
    • Alternatywne biblioteki
    • Przykłady i ćwiczenia
    • Pierwsze kroki z JDBC
    • Nakładki funcyjne dla JDBC
    • Tworzenie warstwy dostępu do danych
    • Operacje na kolumnach
    • Agregacje z Group by
    • Dostęp do metadanych
    • Porównanie JDBC i Slick
    • Web API
    • JSON w Scala
    • Przetwarzanie współbieżne
    • Uwierzytelnianie
    • Aplikacje Klient-Server
    • Tworzenie aplikacji
    • Środowisko Play
    • MongoDB
    • Łączenie z MongoDB z pomocą Casbah
    • Tworzenie złożonych zapytań
    • Serializacja
    • Rozpoczynamy pracę z Akka
    • Tworzenie Actors
    • Routing
    • Strategie
    • Instalacja i konfiguracja Spark
    • Resilient distributed datasets
    • Tworzenie programów
    • Partycjonowanie danych
    • Agregacja Dataframes
    • Przetwarzanie Dataframes
    • Zapytana SQL na Dataframes
    • Złożone typy danych
    • Wprowadzenie do Mlib
    • Komponenty procesu uczenia
    • Ewaluacja
    • Regresja logistyczna
    • Cross-walidacja
    • Zaawansowane algorytmy maszynowego uczenia
    • Tworzenie wykresów
    • Modyfikacja i formatowanie wizualizacji
    • Zaawansowane wykresy
    • Alternatywne metody tworzenia wykresów