Wprowadzenie do Apache Spark
-
Poziom kursu
- Podstawowy
-
Cena za uczestnika
-
1 700,00 zł netto
-
Czas trwania
-
1 dzień
Taniej w grupie
O szkoleniu
Apache Spark to platforma klastrowego przetwarzania danych w szczególności tych określanych mianem Big Data. Spark w przeciwieństwie do Hadoop wykorzystuje przetwarzanie danych w koncepcji in-memory co sprawia że jest wydajniejszy i świetnie sprawdza się na dużych zbiorach danych.
Szkolenie wprowadzenie do platformy Spark przedstawia podstawy pracy na dużych zbiorach danych. W programie zaprezentowane zostały najważniejsze elementy projektu Spark w tym między innymi API, podstawowe narzędzia jak SQL, możliwości streamingu czy wykorzystania Spark w maszynowym uczeniu.
Dla kogo jest to szkolenie?
Szkolenie zostało zaprojektowane jako praktyczne wprowadzenie i przegląd możliwości Apache Spark. Grupą docelową szkolenia są inżynierowie danych analitycy, inżynierowie oprogramowania, menadżerowie IT oraz data scientists którzy dostrzegają potrzebę i korzyści płynące z wykorzystania technologii Spark do analizy danych.
Czego się nauczę?
Po ukończeniu szkolenia:
- Zidentyfikujesz możliwości i potencjał Spark które mogą przynieść korzyści w twojej organizacji
- Poznasz terminologię i technologie powiązane bezpośrednio z Apache Spark
- Nauczysz się pracować z danymi tworząc zapytania na dużych zbiorach danych wykorzystując Spark SQL oraz DataFrames
- Przetworzysz i zmodyfikujesz zadania typu ETL korzystając z API Spark, DataFrames oraz Resilient Distributed Datasets(RDD)
- Nauczysz się korzystać z interfejsu administratora
- Znajdziesz odpowiedzi na nurtujące Cię pytania i dowiesz się gdzie szukać pomocy
Brałeś udział w szkoleniu?
Oceń nas i napisz opinię.