Apache SparkSzkolenia i kursy programowania w różnych językach

Wprowadzenie do Apache Spark

Poziom kursu: Podstawowy
Cena za uczestnika: 1 700,00 zł netto
Czas trwania: 1 dzień

Interesują Cię inne szkolenia? Zobacz więcej

Zapisz się

Zapytaj o szkolenie zamknięte

Terminarz szkoleń

Nie pasuje Ci żaden termin? Napisz do nas!

Zapisz więcej osób

Taniej w grupie

O szkoleniu

Apache Spark to platforma klastrowego przetwarzania danych w szczególności tych określanych mianem Big Data. Spark w przeciwieństwie do Hadoop wykorzystuje przetwarzanie danych w koncepcji in-memory co sprawia że jest wydajniejszy i świetnie sprawdza się na dużych zbiorach danych.

Szkolenie wprowadzenie do platformy Spark przedstawia podstawy pracy na dużych zbiorach danych. W programie zaprezentowane zostały najważniejsze elementy projektu Spark w tym między innymi API, podstawowe narzędzia jak SQL, możliwości streamingu czy wykorzystania Spark w maszynowym uczeniu.

Dla kogo jest to szkolenie?

Szkolenie zostało zaprojektowane jako praktyczne wprowadzenie i przegląd możliwości Apache Spark. Grupą docelową szkolenia są inżynierowie danych analitycy, inżynierowie oprogramowania, menadżerowie IT oraz data scientists którzy dostrzegają potrzebę i korzyści płynące z wykorzystania technologii Spark do analizy danych.

Czego się nauczę?

Po ukończeniu szkolenia:

Zidentyfikujesz możliwości i potencjał Spark które mogą przynieść korzyści w twojej organizacji
Poznasz terminologię i technologie powiązane bezpośrednio z Apache Spark
Nauczysz się pracować z danymi tworząc zapytania na dużych zbiorach danych wykorzystując Spark SQL oraz DataFrames
Przetworzysz i zmodyfikujesz zadania typu ETL korzystając z API Spark, DataFrames oraz Resilient Distributed Datasets(RDD)
Nauczysz się korzystać z interfejsu administratora
Znajdziesz odpowiedzi na nurtujące Cię pytania i dowiesz się gdzie szukać pomocy

Plan szkolenia

1. Przegląd technologii Spark

Czym jest Apache Spark
Dlaczego Spark?
Szanse i korzyści
Komponenty Spark vs Hadoop

2. Podstawy Spark

Środowisko Spark
Korzystanie z shell Spark
Resilient distributed datasets RDD
Programowanie funkcyjne w Spark

3. Podstawy RDD

Struktura i tworzenie RDD z plików
Transformacje, operacje, przekształcenia danych
Key-Value RDD
Interaktywne zapytania z użyciem RDD

4. DataFrames oraz Spark SQL

Tworzenie DataFrames
Tworzenie zapytań na DataFrames i wykorzystanie Spark SQL
Caching
Generowanie raportów

5. Wykonywanie zadań przez Spark

Directed acyclic Graph
Partitions and Shuffles
Wydajność, wykorzystanie pamięci

6. Streaming

Źródła i zadania
Tworzenie Dstreams ze źródeł, API
Operacje na Dstream

7. Podstawy Machine Learning w Spark MLib

Podstawy ML z interfejsem Spark
Przykład maszynowego uczenia z Spark MLib

Brałeś udział w szkoleniu?
Oceń nas i napisz opinię.

Dodaj opinię Google

Wprowadzenie do Apache Spark

Poziom kursu

Cena za uczestnika

1 700,00 zł netto

Czas trwania

1 dzień

Terminarz szkoleń

Taniej w grupie

O szkoleniu

Dla kogo jest to szkolenie?

Czego się nauczę?

Plan szkolenia

1. Przegląd technologii Spark

2. Podstawy Spark

3. Podstawy RDD

4. DataFrames oraz Spark SQL

5. Wykonywanie zadań przez Spark

6. Streaming

7. Podstawy Machine Learning w Spark MLib