13 minut Czytania

Jak zostać Data Scientist?

Jak zostać Data Scientist?

Najlepszą odpowiedzią na to pytanie jest: to zależy. Każdy z nas znajduje się na innym etapie swojego życia, każdy z nas posiada na tę chwilę inne umiejętności, każdy z nas ma inne doświadczenie zawodowe i wykształcenie. W zależności od wymienionych czynników, droga do zostania Data Scientist może być różna – dłuższa dla osób początkujących oraz względnie krótsza dla osób z pewnym doświadczeniem, wykształceniem czy umiejętnościami.

W niniejszym artykule przyjrzymy się konkretnym umiejętnościom oraz narzędziom, które należy doskonalić, żeby zostać Data Scientist. Artykuł będzie miał charakter pewnego planu działania, który wskaże przykładową ścieżkę rozwoju. Plan działania rozpoczniemy od samego początku, żeby każdy był w stanie z niego skorzystać – nawet osoby, które o omawianym zawodzie dowiedziały się wczoraj. Jeżeli podjąłeś już pewne działania, to świetnie! Skupisz się na pozostałych krokach, a Twoja droga do rozpoczęcia kariery jako Data Scientist będzie krótsza.

Grafika symbolizująca ścieżkę rozwoju Data Scientita

Czy wykształcenie wyższe jest wymagane? Jakie umiejętności są niezbędne? Z jakich narzędzi korzysta Data Scientist? Jak zdobyć pierwszą pracę? Zapraszam do przeczytania artykułu, dzięki czemu uzyskasz odpowiedź na powyższe pytania.

Nie wiesz kim jest Data Scientist? Odpowiedź na to pytanie znajdziesz w innym artykule.

Wykształcenie wyższe – czy jest konieczne?

Wykształcenie wyższe jest konieczne w przypadku niektórych zawodów, np. zawodu lekarza, architekta czy prawnika. Czy to samo dotyczy Data Scientista?

Praca Data Scientista z pewnością jest odpowiedzialna, wymaga konkretnych umiejętności oraz predyspozycji, jednak wykształcenie wyższe nie jest koniecznością. We współczesnym świecie potencjalni pracodawcy przykładają coraz większą wagę do posiadanych umiejętności, a wykształcenie wyższe przestaje być priorytetem przy zatrudnianiu pracowników. Wspomnianą zależność można zaobserwować sektorze IT, w tym również w branży Data Science.

Wykształcenie wyższe nie jest koniecznością, jednak z pewnością ułatwi nam drogę do zdobycia pierwszej pracy jako Data Scientist. Według raportu State of Data Science 2021, aż 68% Data Scientistów w 2021 roku posiadało wykształcenie wyższe, więc jest to zdecydowana większość. Podczas studiów rozwijamy wiele istotnych umiejętności oraz poznajemy kluczowe narzędzia, a motywacja do nauki z reguły jest większa niż w przypadku samodzielnego zdobywania wiedzy.

Trudno jest znaleźć kierunek, który przygotowuje bezpośrednio do roli Data Scientista, więc warto rozważyć kierunki studiów, podczas których będziemy mieli kontakt z analizą, danymi, matematyką, statystyką i informatyką. Do takich kierunków należą np.: matematyka, statystyka, informatyka, fizyka. Odpowiednim kierunkiem studiów będzie każdy, podczas którego wykorzystywane są metody ilościowe, więc nie musimy ograniczać się do wymienionych.

Symbole oznaczające Data Scientist.

Jeżeli ukończyłeś studia niekoniecznie związane z metodami ilościowymi, a rozpoczęcie kolejnego kierunku studiów jest niemożliwe, to nic straconego. Warto pamiętać, że Data Scientist jest wszechstronną osobą, której wiedza nie ogranicza się tylko do matematyki, statystyki czy informatyki. Trudno jest znaleźć dziedzinę życia, w której Data Science nie miałoby zastosowania, więc możesz ze swojego specjalistycznego wykształcenia uczynić zaletę.

Nie lekceważ matematyki i statystyki. Rozwijaj swoje umiejętności analityczne

Codzienna praca Data Scientista polega na przetwarzaniu i analizowaniu liczb. Z pewnością znajdziemy dane, które jesteśmy w stanie przeanalizować bez wykorzystywania liczb, jednak Data Scientist podczas analizy posługuje się głównie liczbami. Wykonywanie operacji na liczbach nie może sprawiać mu trudności, a wzory matematyczne nie powinny go przerażać. Matematyka rozwija również kluczowe zdolności, którymi charakteryzuje się każdy Data Scientist – zdolność logicznego myślenia, wyciągania wniosków, szukania zależności.

Data Scientist nie może wykonywać losowych operacji na liczbach, więc niezbędna jest również znajomość statystyki. Liczby muszą zostać przetworzone i zinterpretowane w odpowiedni sposób, a zbiorem takich zasad jest właśnie statystyka. Stopień trudności statystyki może być zróżnicowany w zależności od konkretnej analizy – od obliczenia średniej, po przeprowadzenie prognozy lub testu zgodności.

Nie każdą zależność można znaleźć poprzez zastosowanie odpowiedniego wzoru czy testu statystycznego. Data Scientist bardzo często musi spojrzeć na dane w odpowiedni sposób, zadać odpowiednie pytanie, poszukać na nie odpowiedzi, po czym postarać się wyciągnąć odpowiedni wniosek. Są to sytuacje, w których bardzo przydatne są nasze umiejętności analityczne – spostrzegawczość, szczegółowość, łączenie faktów.

Lornetka, żaróka i zbiór - symbole Data Scientist

W jaki sposób zrealizować omawiany punkt? W teorii jest to bardzo proste – na studiach i w szkole nie unikaj matematyki, rozwiązuj zadania matematyczne; poznawaj zagadnienia statystyczne oraz postaraj się je wykorzystać w praktyce; czytaj inne analizy, zgłębiaj temat, zwracaj uwagę na część techniczną.

Opanuj podstawowe narzędzia

Do przetwarzania i analizy danych będziesz potrzebować odpowiednich narzędzi. Jeżeli nie posiadasz większego doświadczenia w pracy z danymi, a Excel jest Ci obcy, to proponuję rozpocząć naukę właśnie od niego. Oswoisz się z organizacją danych w tabelach, zrozumiesz sposób ich przetwarzania, nauczysz się tworzyć podstawowe wykresy. Znajomość Excela jest bardzo dobrym punktem wyjścia, który pomoże Ci zrozumieć w jaki sposób dane są przetwarzane przez inne narzędzia. Nie musisz poświęcać na to wiele czasu – warto poznać podstawy, oswoić się z tabelami, znać średniozaawansowane funkcje, po czym płynnie przejść do poznawania kolejnych bardziej zaawansowanych narzędzi.

Kolejnym narzędziem, z którym warto się zapoznać, jest język zapytań SQL. Jest to język, który służy do tworzenia baz danych, zarządzania nimi, przetwarzania danych oraz wyciągania z nich odpowiednich informacji. SQL jest językiem, więc w tym przypadku nie będziemy korzystać z odpowiedniego interfejsu – tak jak było to w przypadku Excela – a kolejne operacje będziemy wykonywać pisząc instrukcje. Będzie to dobry wstęp przed nauką języków programowania, które charakteryzują się znacznie bardziej złożoną składnią i znacznie większymi możliwościami. Gdy poznasz już Excela i SQLa, możesz spróbować połączyć oba narzędzia w jednym projekcie.

Znajomość SQLa oraz Excela jest dobrym fundamentem do rozpoczęcia nauki programowania. Można tutaj wymienić kilka języków, jednak moim zdaniem najlepszym wyborem jest Python lub R. Oba języki są równie dobre i popularne, więc na pewno warto od nich zacząć. Na początek proponuję skupić się na jednym z nich, a gdy już go opanujemy, to warto rozważyć naukę drugiego – znajomość jednego języka z pewnością przyspieszy proces nauki kolejnego. Nauka języków programowania jest etapem, któremu warto poświęcić więcej czasu. Powinniśmy zrozumieć podstawowe pojęcia z zakresu programowania, zaznajomić się ze strukturą języka i poznać jego podstawowe funkcjonalności, po czym przejść do nauki odpowiednich bibliotek stworzonych z myślą o Data Science.

Znajomość języków programowania jest kluczowa dla Data Scientista – za ich pomocą można przetwarzać, analizować i wizualizować dane znacznie sprawniej niż w Excelu; automatyzować wiele procesów; tworzyć modele uczenia maszynowego. Jeżeli chciałbyś dowiedzieć się więcej na temat Pythona oraz R, to zapraszam do zapoznania się z artykułem: R czy Python? Który język wybrać.

Dobra znajomość Excela, SQLa i jednego z języków programowania to już bardzo dobra podstawa. Kolejnymi narzędziami, które warto poznać, są narzędzia do wizualizacji danych, np. Tableau lub PowerBI. Są to narzędzia, które znacznie usprawniają i ułatwiają proces wizualizacji danych, udostępniają wiele gotowych i estetycznych wykresów, umożliwiają ich modyfikację. Jeżeli jesteś już na tym etapie, to nauka wspomnianych narzędzi nie sprawi Ci żadnych trudności i przebiegnie względnie szybko.

Symbole języków programowania - od lewej Pythona, R, SQL, Power B.

Gdy poznasz wcześniej wymienione narzędzia, to warto przyjrzeć się narzędziom ułatwiającym i usprawniającym proces przetwarzania dużych ilości danych – Hadoop lub Spark. Komputery, które wykorzystujemy do pracy, mają ograniczone możliwości i bez specjalnych technik nie byłyby w stanie przetworzyć większych zbiorów danych. Z pomocą przychodzą wspomniane narzędzia, które zarządzają zbiorami w odpowiedni sposób, dzięki czemu pamięć podręczna komputera nie jest już żadnym ogranicznikiem. W pewnym momencie ważną kwestią staje się również czas, a Hadoop i Spark zostały stworzone w taki sposób, żeby być jak najbardziej wydajnymi.

Poznaj biblioteki do uczenia maszynowego

Uczenie maszynowe jest częścią sztucznej inteligencji (AI) i zajmuje się uczeniem komputerów na podstawie danych. Proces nauki nie jest z góry zaprogramowany, a komputer doskonali się wraz ze zdobywanym doświadczeniem. W ostatnich latach uczenie maszynowe znacznie zyskało na popularności, przez co jest to niezbędna umiejętność każdego Data Scientista.

Uczenie maszynowe wykonywane jest w językach programowania, a najpopularniejszymi językami wykorzystywanymi w tym celu są R oraz Python – w obu językach dostępnych jest wiele bibliotek przeznaczonych do tego celu. Trudno wskazać faworyta, jednak w przypadku uczenia głębokiego (część uczenia maszynowego) zdecydowanie lepszym wyborem jest Python. Jeżeli chciałbyś dowiedzieć się więcej na temat uczenia maszynowego w obu językach, to ponownie zapraszam do zapoznania się z artykułem: R czy Python? Który język wybrać.

Symbole sztucznej inteligencji, uczenia maszynowego i Data Scientist

Stwórz swoje portfolio

Na tym etapie warto wykorzystać zdobytą wiedzę i umiejętności w praktyce i stworzyć ciekawy projekt, który zwróci na Ciebie uwagę potencjalnego pracodawcy. Niestety w branży Data Science konkurencja jest na tyle duża, że wysyłając CV bez portfolio, często nie będziesz nawet brany pod uwagę w procesie rekrutacji.

W Internecie jest wiele pomysłów na projekty do portfolio, jednak uważam, że najbardziej wartościowymi projektami są te, które udało się samodzielnie wymyślić. Warto pomyśleć nad projektem, który rozwiąże jeden z naszych problemów, zautomatyzuje cykliczny proces lub ułatwi pewnym osobom ich obowiązki. Praktyczność projektu jest cenioną cechą, jednak nie jest to niezbędne. Najważniejsze jest to, żeby projekt był ciekawy i pokazywał Twoje umiejętności.

Ile projektów powinno zawierać moje portfolio? Nie istnieje żadna zasada, która mogłaby to określić – wszystko zależy od tego jak bardzo projekty są rozbudowane. Niektórzy preferują krótsze i mniej skomplikowane projekty, a inni długie i rozbudowane. W przypadku dłuższych projektów niezbędna jest cierpliwość w ich realizacji, a w przypadku krótszych pomysłowość, która pomoże w szukaniu inspiracji na następne projekty.

Data Scientist zajmuje się analizą danych, więc w portfolio powinny znaleźć się również analizy dotyczące konkretnych zagadnień. Znajdź temat, który Cię interesuje; poszukaj danych, na podstawie których mógłbyś przeprowadzić analizę; przeanalizuj zagadnienie, wyciągnij wnioski, stwórz raport. Dobrym pomysłem jest np. analiza sportowa dotycząca dyscypliny, którą się interesujemy.

Zdobądź pierwszą pracę w branży Data Science

Jeżeli przeczytałeś artykuł o tym kim jest Data Scientist, to mogłeś się zorientować, że jest to bardzo wymagająca rola. W branży Data Science istnieje również kilka innych ról, w których zakres wymaganych umiejętności jest znacznie węższy. Na pierwsze stanowisko warto rozważyć inne role, podczas których zdobędziemy cenne doświadczenie i umiejętności, które przydadzą się później w roli Data Scientista.

Rola Data Analysta będzie bardzo dobrym wyborem w drodze do roli Data Scientista. Pracę jako Data Analyst możemy znaleźć już na etapie znajomości podstawowych narzędzi i wykonania kilku analiz do portfolio. Znajomość uczenia maszynowego nie jest wymagana, więc jest to bardzo dobre rozwiązanie – zdobywamy doświadczenie zawodowe, a w swoim wolnym czasie dalej się rozwijamy i poznajemy narzędzia wykorzystywane do uczenia maszynowego.

Na rynku pracy można spotkać również oferty kierowane do Junior Data Scientistów. Jak sama nazwa wskazuje, jest to stanowisko niższe rangą od Data Scientista, jednak zakres obowiązków będzie podobny do docelowej roli. W odróżnieniu od Data Analysta, wymagana jest podstawowa znajomość zagadnień związanych z uczeniem maszynowym.

Wiemy jakich ofert pracy szukać, jednak istotną kwestią są również rozmowy o pracę. Gdy zwrócimy na siebie uwagę potencjalnego pracodawcy i zostaniemy zaproszeni na rozmowę, to powinniśmy się do niej odpowiednio przygotować. Każdy ma swoje zdanie o procesach rekrutacji, nie każdy lubi HRowe pytania, jednak jest to etap, przez który również trzeba przejść. Jeżeli aplikujesz na dane stanowisko, to najprawdopodobniej podstawowe narzędzia masz już opanowawne do tego stopnia, że zbędnym jest powtarzanie wiedzy technicznej. Skup się na części HRowej, w której mogą pojawić się pytania takie jak:

potencjalne pytania na rozmowie o pracę jako Data Scientist

Przed rozmową powinniśmy poczytać o organizacji, w której chcielibyśmy rozpocząć pracę oraz przygotować się na najbardziej popularne pytania. W ten sposób pokazujemy, że oferta danej organizacji naprawdę nas interesuje, a potencjalny pracodawca ma pewność, że rozmawia z poważną osobą.

Pracuj, rozwijaj się, bądź na bieżąco z technologią

Zdobycie pierwszej pracy – jako Data Analyst lub Junior Data Scientist – jest już małym sukcesem, jednak nie możemy zapomnieć, że nasze docelowe stanowisko jest inne. Powinniśmy dalej poszerzać nasze kompetencje, poznawać nowe narzędzia, uczyć się od bardziej doświadczonych osób z naszej pracy. Jeżeli nie przestaniemy się rozwijać to ostatecznie osiągniemy nasz cel, którym jest stanowisko Data Scientista.

Gdy zostaniemy już Data Scientist, to nasz proces nauki się nie kończy. Data Science to branża, która bardzo dynamicznie się rozwija, przez co musimy śledzić najnowsze technologie. Bardzo możliwe, że wykorzystywane przez nas narzędzia zostaną zastąpione innymi, lepszymi, bardziej wydajnymi. Jeżeli po otrzymaniu docelowego stanowiska przestaniemy się rozwijać, to rynek pracy nas zweryfikuje i w takiej sytuacji będziemy mieli dwa wyjścia: nadrobić stracony czas lub zmienić zawód.

symbole rozwoju osobistego niezbędne w pracy Data Scientist

Podsumowanie

Droga do stanowiska Data Scientist może się różnić w zależności od naszego dotychczasowego doświadczenia, wykształcenia czy umiejętności. Wykształcenie wyższe nie jest konieczne, jednak może okazać się pomocne przy szukaniu pierwszej pracy. Niezbędna jest dobra znajomość matematyki, statystyki i umiejętności analizy. Data Scientist musi również znać zestaw narzędzi do przetwarzania i analizy danych, do których można zaliczyć między innymi: SQLa, Pythona/R-a, Hadoopa/Sparka, Tableau/PowerBI. Konieczna jest również znajomość odpowiednich bibliotek stworzonych do uczenia maszynowego.

Gdy opanujemy już podstawowe narzędzia i zdobędziemy odpowiednie umiejętności, to warto stworzyć swoje portfolio. Kolejnym krokiem będzie znalezienie pierwszej pracy, zdobywanie doświadczenia zawodowego i dalszy rozwój. Data Science to bardzo dynamicznie zmieniająca się branża, więc gdy zaczniemy pracę na stanowisku Data Scientist, to nasza nauka się nie kończy.

Z pewnością zdobycie stanowiska Data Scientist nie jest prostym zadaniem, jednak praca na omawianym stanowisku szybko ten trud wynagrodzi – jest to ciekawa i dobrze płatna praca z wieloma możliwościami rozwoju. W drodze do zdobycia omawianego stanowiska pomocne mogą okazać się szkolenia, więc zapraszam do zapoznania się z naszą ofertą. Podczas naszych szkoleń poznasz niezbędne narzędzia wykorzystywane przez Data Scientistów, wyrobisz poprawne nawyki podczas pracy z danymi i zdobędziesz wartościową wiedzę z branży Data Science.