Kto ma pracować w Data Science i od czego zacząć

Dziś specjaliści Data Science są potrzebni niemal w każdym obszarze biznesu. Nie chodzi tylko o kwestie finansowe

lub firmy informatyczne. Analitycy danych są poszukiwani w marketingu, sprzedaży, rozwoju produktów, podejmowaniu decyzji zarządczych, przewidywaniu ruchu i zapewnianiu bezpieczeństwa złożonych systemów technologicznych.

Zapotrzebowanie na specjalistów data science jest innekwalifikacje rosną z każdym rokiem. Według MADE Big Data Academy z Mail.ru Group oraz portalu rekrutacyjnego HeadHunter w 2019 roku było 1,4 razy więcej wakatów w obszarze analizy danych w porównaniu z 2018 rokiem. Liczba wakatów w dziedzinie uczenia maszynowego wzrosła 1,3-krotnie.

Rosną również zarobki analityków danych. Według HH.ru, nawet junior w Rosji otrzymuje około 120 tysięcy rubli, podczas gdy analityk biznesowy może już liczyć na 170 tysięcy rubli i więcej, a analityk big data - od 200 tysięcy rubli.

Kto jest poszukiwany i dlaczego?

Najczęściej w Rosji szukają analityków danychfirmy finansowe i IT. Najczęstszym wymaganiem dla kandydatów jest znajomość języka programowania Python. Występuje w 45% miejsc pracy w data science i prawie połowa (51%) w uczeniu maszynowym.

Oczywiście rośnie także liczba analityków danych. Według HH.ru co miesiąc 246 specjalistów od analizy danych i 47 specjalistów od uczenia maszynowego publikuje swoje CV.

Lista wymagań od kandydatów obejmuje również:

  • znajomość SQL;
  • posiadanie eksploracji danych (Data Mining);
  • pewna znajomość statystyki matematycznej;
  • umiejętność pracy z big data;
  • posiadanie C ++, Git, Linux.

Jednocześnie około 65% wolnych miejsc pracy w dziedzinie analizydane i 50% wolnych miejsc pracy specjalistów w dziedzinie uczenia maszynowego znajduje się w Moskwie. Petersburg zajmuje drugie miejsce w Rosji (odpowiednio 15% i 18%). Oczywiście osoby poszukujące pracy są również głównie skoncentrowane w obu stolicach. Ale dziś, aby przejść szkolenie, nie trzeba gdzieś się przeprowadzać, ale praca w formacie zdalnym, na outsourcingu, staje się już nowym formatem organizacji przepływu pracy.

Gdzie studiować dla analityka danych i co jest do tego potrzebne?

Istnieje kilka podejść do nauki wnaukowiec danych. Jeden z nich jest bardziej klasyczny, aby wejść na uniwersytet w obszarach IT. Można to zrobić również za granicą. Np. Studia magisterskie z Data Science na amerykańskiej uczelni mogą kosztować bardzo imponującą kwotę: od 30 tysięcy do 120 tysięcy dolarów. Nawet kursy online na zagranicznych uczelniach w tej specjalności kosztują co najmniej 9 tysięcy dolarów. Są tacy, którzy nie są na to gotowi wydać na szkolenie na taką skalę, bo takie koszty trzeba jeszcze zwrócić, ale nie stanie się to od razu. Na przykład badaczka danych Rebecca Vickery, która zajmuje się tą dziedziną od 10 lat, stworzyła własny program, zgodnie z którym niezależnie studiowała naukę o danych. Takie podejście ma również swoje wady: brak informacji zwrotnej i wsparcia ze strony mentora lub nauczyciela, odległość od zespołu, praca w pojedynkę i wreszcie wielu osobom ten proces uczenia się jest nudny.

Inną opcją jest szkolenie onlinespecjalistyczne szkoły cyfrowe, takie jak SkillFactory. Uczniowie nie tylko uczą się zestawu technik i technik, ale także uczą się uczyć. Ponadto każdy student będzie miał mentora, który zapewnia wsparcie i pomoc, a cała praca wykonana w procesie uczenia się może służyć nie tylko jako portfolio. Będąc jeszcze studentem SkillFactory, przyszły analityk danych wkracza do społeczności branżowej - pomaga to nie tylko znaleźć pracę, ale także komunikować się z kolegami i dzielić się doświadczeniami. Szkoła internetowa jest przekonana, że ​​nie wystarczy uczyć się nowych technologii - trzeba opanować nowe podejścia i nowe sposoby myślenia. I trudno sobie z tym poradzić samemu. Dlatego wszyscy uczniowie udzielają sobie nawzajem informacji zwrotnych, wymieniają się kodami, pomagają znajdować błędy i udostępniać problemy i prawdziwe przypadki.

Co powinien umieć młodszy analityk danych:

  • używać podstawowych konstrukcji algorytmicznych i struktur danych Pythona do projektowania algorytmów;
  • wizualizuj dane za pomocą Pandas, Matplotlib, Seaborne;
  • tworzyć przemysłowe modele jakości przy użyciu klasycznego uczenia maszynowego i sieci neuronowych do rozwiązywania problemów Data Science;
  • ocenić jakość modelu (precyzja / odtworzenie);
  • zintegrować rozwiązanie z produkcją i ogólnie biznesem;
  • pracować z hurtowniami danych różnego typu;
  • praca z narzędziami do analizy dużych zbiorów danych;
  • otrzymywać dane ze źródeł internetowych lub przez API;
  • stosuje metody analizy matematycznej, algebry liniowej, statystyki i teorii prawdopodobieństwa do przetwarzania danych.

Jeśli te umiejętności wydają Ci się bardzo trudne, możesz wziąć udział w kursach Data Scientist Profession.

Kim jest data science i co powinien umieć?

W istocie następna jest nauka o danych„Ewolucyjny” krok ludzkości w pracy z danymi. Wcześniej matematycy i statystycy rozwiązali podobne problemy. Teraz, wraz z pojawieniem się sztucznej inteligencji, optymalizacji i informatyki weszły do ​​metod analizy danych, co oznacza, że ​​nowe podejście do znajdowania rozwiązań opartych na danych stało się znacznie bardziej efektywne niż poprzednie metody „analogowe”.

Praca analityka danych zaczyna się od gromadzenia danychduże zbiory danych: uporządkowane i nie. Następnie są konwertowane do formatu, który jest łatwy do odczytania. Kolejny etap: wizualizacja i praca ze statystykami. Jako metody analityczne stosuje się uczenie maszynowe i głębokie, analizę probabilistyczną, modele predykcyjne i sieci neuronowe.

Pięć podstaw dla naukowca danych

  • Sztuczna inteligencja (AI) to obszarpoświęcony tworzeniu inteligentnych systemów, które działają i zachowują się jak ludzie. Sztuczna inteligencja wiąże się z podobnym celem, jakim jest używanie komputerów do zrozumienia ludzkiej inteligencji, ale niekoniecznie ogranicza się do metod biologicznie wiarygodnych. Istniejące dziś inteligentne systemy mają bardzo wąskie obszary zastosowań. Na przykład programy, które mogą pokonać osobę w szachy, nie mogą odpowiadać na pytania.
  • Nauczanie maszynowe -stworzenie narzędzia do wydobywania wiedzy z danych. Modele ML są trenowane na danych samodzielnie lub etapami: szkolenie z nauczycielem na danych przygotowanych przez osobę i bez nauczyciela - praca z danymi spontanicznymi, zaszumionymi.
  • Głęboka nauka -budowanie wielowarstwowych sieci neuronowych w obszarach, w których wymagana jest bardziej zaawansowana lub szybsza analiza, a tradycyjne uczenie maszynowe zawodzi. „Głębokość” jest zapewniana przez szereg ukrytych warstw neuronów w sieci, które wykonują obliczenia matematyczne.
  • Big Data - praca z bigilość często nieustrukturyzowanych danych. Specyfiką kuli są narzędzia i systemy, które mogą wytrzymać duże obciążenia.
  • Data Science - wsednem tej dziedziny jest wzmacnianie zbiorów danych, wizualizacja, zbieranie pomysłów i podejmowanie decyzji na podstawie tych danych. Analitycy danych wykorzystują szereg technik uczenia maszynowego i Big Data: przetwarzanie w chmurze, narzędzia do tworzenia wirtualnego środowiska programistycznego i wiele innych.

Jak każdy inny zawód, opanowanie danychNauka zaczyna się od podstaw - nauki matematyki, algebry liniowej i oczywiście statystyki. Aby dobrze zrozumieć naukę o danych, przyszły specjalista będzie potrzebował prawdziwego kursu uniwersyteckiego z teorii prawdopodobieństwa (w tym rachunku różniczkowego). Na szczęście dziś takie materiały łatwo znaleźć w internecie, a nawet zapisać się na semestr na najlepszych rosyjskich uczelniach na platformie Open Education. Lub weź udział w pełnym kursie Data Science w SkillFactory, gdzie podstawowa wiedza będzie pierwszym krokiem do opanowania nowego zawodu. Wiedza matematyczna jest ważna przede wszystkim w celu analizy wyników stosowania algorytmów przetwarzania danych. Oczywiście w uczeniu maszynowym są silni inżynierowie bez takiego wykształcenia. Ale są to w większości rzadkie przypadki.

Drugim krokiem do zostania naukowcem danych jest programowanie. Wystarczy nauczyć się przynajmniej jednego języka, po opanowaniu wszystkich niuansów jego składni. Jak wspomniano powyżej, jednym z najpopularniejszych języków jest Python.

Uczenie maszynowe - trzeci składnikzawód naukowca danych, kiedy nie musi już pisać instrukcji dla komputerów do wykonywania określonych zadań. ML ma trzy główne formy: uczenie się nadzorowane, uczenie się bez nadzoru i uczenie się ze wzmocnieniem. Możesz przeczytać więcej o każdym rodzaju szkolenia w naszym obszernym materiale z profesorem Janem Lekunem.

I wreszcie ostatni krok to Data Mining (analizadata) oraz wizualizacja danych, która jest ważnym procesem badawczym i obejmuje analizę ukrytych modeli danych zgodnie z różnymi opcjami przełożenia na przydatne informacje, które są gromadzone i formowane w hurtowniach danych w celu ułatwienia podejmowania decyzji biznesowych mających na celu obniżenie kosztów i zwiększenie przychodów.

Pomimo tego, że edukację można uzyskać wdość krótkie terminy, analityk danych musi regularnie potwierdzać swoje kwalifikacje, przechodząc wysokospecjalistyczne kursy, biorąc udział w hackathonach, otwartych konkursach i szukając pracy. Samodzielne potwierdzenie swoich kwalifikacji będzie dodatkowym atutem. Na przykład zaawansowany profil na Kaggle, który ma system rang. Możesz przejść od nowicjusza do arcymistrza. Za udany udział w konkursach, publikację scenariuszy i dyskusje otrzymujesz punkty, które zwiększają Twoją ocenę. Ponadto witryna odnotowuje, w jakich konkursach brałeś udział i jakie są Twoje wyniki.

Zastosuj

Zobacz także:

Zobacz, gdzie teraz lata łazik Perseverance

Objawy koronawirusa u dzieci. Na co powinieneś zwrócić uwagę?

Astronomowie widzą, jak czarna dziura emituje migoczące promienie gamma