Szkolenia i kursy programowania w różnych językachSzkolenia z języka Python

Data scraping w Python

Poziom kursu: Średniozaawansowany
Cena za uczestnika: 1 900,00 zł netto
Czas trwania: 2 dni

Interesują Cię inne szkolenia? Zobacz więcej

Zapisz się

Zapytaj o szkolenie zamknięte

Terminarz szkoleń

Nie pasuje Ci żaden termin? Napisz do nas!

Zapisz więcej osób

Taniej w grupie

O szkoleniu Data Scraping w języku Python

Kurs ten jest przeznaczony dla osób, które chciałyby nauczyć się najlepszych praktyk data scrapingu, czyli pozyskiwaniu danych z róznych źródeł, za pomocą Pythona. Szkolenie głównie kładzie nacisk na web scraping, czyli automatyzację pobierania danych ze stron internetowych, natomiast poruszone zostaną również techniki ekstrakcji użytecznych danych z plików tekstowych. Uczestnik pozna najpopularniejsze biblioteki takie jak BeautifulSoap, Scrapy oraz Selenium. Oprócz teorii koniecznej do zrozumienia zagadnienia w trakcie kursu przekazywana jest również praktyczna wiedza, która pozwoli uczestnikom tworzyć wydajne i łatwe w utrzymaniu projekty pozyskujące dane. Prezentacja każdego konceptu będzie się wiązała z tworzeniem miniprojektu ekstraktującego dane, a na koniec szkolenia zostanie utworzony projekt końcowy polegający na utworzeniu ETL pipeline – ,programu który pobierze dane z publicznej strony internetowej, wyczyści je i zapisze w ustrukturyzowanej formie w zdefiniowanej przez nas bazie danych.

Osoby posiadające podstawową wiedzę i umiejętności związane z Pythonem powinny bez problemu zrozumieć treści kursu. Dla osób, które dopiero zaczynają programować w Pythonie może być konieczne wykonanie pewnej dodatkowej pracy wstępnej.

Dla kogo jest to szkolenie?

Analitycy wykorzystujący Python
Naukowcy
Data scientist
Developerzy Python

Czego się nauczę?

Po ukończeniu szkolenia uczestnik:

Dowie się czym jest protokół HTTP i podstaw odnośnie struktury dokumentów HTML
Nauczy się wyciągać z dokumentów HTML interesujące Cie informacje
Nauczy się łączyć z internetowym API serwującym dane
Dowie się czym jest Web crawling i jak go zaimplementować
Pozna pakiety BeautifulSoap, Scrapy oraz Selenium. Najpopularniejsze narzędzia do web scrapingu w Python.
Dowie się jakie są legalne oraz etyczne ograniczenia dotyczace pozyskiwania danych z publicznie dostępnych źródeł
Stworzy kompletny projekt będący ETL Pipeline’m, dokonujący ekstracji danych z pewnego źródła, czyszczeniu ich i zapisujący je w uporządkowanej strukturz bazo danowej

Plan szkolenia

1. Wstęp do web scrapingu

Czym jest web scraping
Zapytania HTTP
Api scraping
Stuktura dokumentów HTML

2. BeautifulSoup

Parsowanie HTML
Wybieranie elementów DOM
Custom selectors
CSS selectors
Wyrażenia regularne

3. Web crawling

Czym jest web crawling?
Tworzenie wikipediowego crawlera
Crawling całej strony
Legalne i etyczne aspekty web scrapingu
Modele do web crawlingu

4. Scrapy

Tworzenie i uruchamianie pierwszego pająka
Selectors
Items
Item loaders i Item Pipeline
Podążanie za linkami
Unikanie zbanowania

5. Scraping z plików tekstowych

Pdf
Pliki Word
Procesowanie języka naturalnego

6. Scraping javascript z Selenium

Wstęp do javascript
Podstawy Selenium
Selectors

7. Projekt końcowy

Tworzenie crawlera
Czyszczenie danych
Przechowywanie danych w bazie danych

Brałeś udział w szkoleniu?
Oceń nas i napisz opinię.

Dodaj opinię Google

Data scraping w Python

Poziom kursu

Cena za uczestnika

1 900,00 zł netto

Czas trwania

2 dni

Terminarz szkoleń

Taniej w grupie

O szkoleniu Data Scraping w języku Python

Dla kogo jest to szkolenie?

Czego się nauczę?

Plan szkolenia

1. Wstęp do web scrapingu

2. BeautifulSoup

3. Web crawling

4. Scrapy

5. Scraping z plików tekstowych

6. Scraping javascript z Selenium

7. Projekt końcowy