Text Mining i Przetwarzanie Języka Naturalnego z Python
-
Poziom kursu
- Zaawansowany
-
Cena za uczestnika
-
3 250,00 zł netto
-
Czas trwania
-
4 dni
Taniej w grupie
O szkoleniu
Jedną z bardzo ważnych umiejętności na wyposażeniu Data Scientist jest umiejętność przetwarzania języka naturalnego (z ang. Natural Language Processing) oraz text mining. Szybko rosnąca liczba źródeł danych tekstowych i ich większy wolumen odpowiadają w dużej mierze za znaczenie jakie przypisuje się obecnie umiejętności analizy danych tekstowych. Prezentowane szkolenie odpowiada na potrzeby wszystkich poszukujących umiejętności analizy dokumentów i danych tekstowych, szukania wzorców i ekstrakcji informacji umożliwiającej nam lepsze zrozumienie naszych klientów i biznesu.
Warsztatowa forma szkolenia dostarcza zarówno wiedzy teoretycznej dla lepszego zrozumienia koncepcji NLP i Text Mining oraz praktycznych umiejętności analizy danych tekstowych w Python. Zastosowanie języka Python do prezentacji przykładów, ćwiczeń i studium przypadków umożliwia uczestnikom zbudowanie gotowych rozwiązań problemów z obszaru text mining i pozwala lepiej przyswoić skomplikowane koncepcje przetwarzania języka naturalnego. Po ukończeniu szkolenia uczestnicy będą dysponowali skryptami umożliwiającymi rozwiązanie większości problemów z obszaru Text Mining i NLP.
NLP to jedna z głównych składowych sztucznej inteligencji (z ang. Artificial Intelligence). Za pomocą algorytmów komputerowych, koncepcji matematycznych i statystycznych NLP stara się przetworzyć i zrozumieć tekst tak jak człowiek (najczęściej spotykane problemy NLP to m.in automatic summarization, part-of-speech tagging, disambiguation, entity extraction). Text mining to metoda eksploracji danych służąca wydobywaniu informacji z tekstu. Text mining wykorzystuje różne metody analizy danych wsród których najważniejsze są NLP oraz algorytmy maszynowego uczenia. Pomysł połączenia NLP i text mining w jedno szkolenie wynika z dużego potencjału jaki niesie jednoczesne wykorzystanie tych metod przy analizie danych tekstowych i dokumentów.
W części praktycznej szkolenia do tworzenia aplikacji NLP i text mining wykorzystujemy środowisko programistyczne Python głównie z uwagi na dużą dostępność narzędzi i bibliotek do NLP i text mining. Najważniejszą i jednocześnie najczęściej wykorzystywaną do NLP biblioteką Python jest NLTK, z prostą składnią i ogromną liczbą funkcji sprawia że nawet najbardziej złożone zadania NLP można rozwiązać za pomocą kilku linii kodu. Ponadto prosta składnia Python oraz duża dostępność innych pakietów do analizy danych sprawia że Python jest jednym z najczęściej wybieranych języków Data Science. Jeżeli chcesz dowiedzieć się więcej przeczytaj nasz artykuł R czy Python? Który język programowania wybrać w 2023 roku? .
Dla kogo jest to szkolenie?
- Data Scientist pragnący rozszerzyć warsztat analityczny o umiejetność analizy danych tekstowych
- Programiści projektujący systemy mające m.in. interpretować i odkrywać wiedzę z danych tekstowych
- Wszyscy zainteresowani zdobyciem wiedzy i praktycznych umiejętności przetwarzania języka naturalnego i text mining z Python
Czego się nauczę?
Po ukończeniu szkolenia:
- Poznasz problemy i sposoby ich rozwiązania metodami rozwijanymi w ramach przetwarzania języka naturalnego i zastosowanie metody maszynowego uczenia w analizie tekstu
- Zrozumiesz koncepcje i pojęcia obecne w analizie tekstu naturalnego między innymi Corpus, NLU, NLG.
- Poznasz techniki przygotowania dokumentów i tekstu do przetwarzania i transformacji oraz nauczysz się je dostosowywać do potrzeb analizy
- Poznasz algorytmy NLP niezbędne do pracy i analizy danych tekstowych
- Nauczysz się przetwarzać dane wykorzystując metody NLP do generowania danych na potrzeby algorytmów maszynowego uczenia
- Poznasz najnowsze koncepcje i model wykorzystywane w NLP takie jak word2vec, doc2vec, GloVe i inne
- Nauczysz się przeprowadzać proces klasyfikacji tekstu i dokumentów zaawansowanymi metodami maszynowego uczenia
- Dowiesz się jak wykrywać nazwy własne i wykorzystać je w text mining
- Poznasz i nauczysz się zastosować w praktyce metody modelowania tematycznego
- Dowiesz się jak przeprowadzić segmentację dokumentów za pomocą metod maszynowego uczenia
- Nauczysz się wykorzystywać metody maszynowego uczenia i przetwarzania języka naturalnego do analizy semantycznej i sentymentu
- Liczne studia przypadku ugruntują twoją wiedzę i pomogą budować usystematyzowane skrypty Python do przetwarzania i analizy danych tekstowych
Brałeś udział w szkoleniu?
Oceń nas i napisz opinię.