Danas su stručnjaci za znanost o podacima potrebni u gotovo svim područjima poslovanja. Ne radi se samo o financijama
Potražnja za stručnjacima za znanost o podacima različita jekvalifikacije rastu svake godine. Prema MADE Big Data Academy iz Mail.ru Group i regrutnom portalu HeadHunter, u 2019. godini bilo je 1,4 puta više slobodnih mjesta na polju analize podataka u odnosu na 2018. godinu. A broj slobodnih mjesta na polju strojnog učenja porastao je 1,3 puta.
Zarada znanstvenika podataka također raste. Prema HH.ru, čak i junior u Rusiji prima oko 120 tisuća rubalja, dok poslovni analitičar već može računati na 170 tisuća rubalja i više, a analitičar velikih podataka - od 200 tisuća rubalja.

Tko je tražen i zašto?
Najčešće u Rusiji traže znanstvenike za podatkefinancijske i IT tvrtke. A najčešći zahtjev za pristupnike je znanje programskog jezika Python. Javlja se na 45% poslova u znanosti o podacima i gotovo polovici (51%) u strojnom učenju.
Naravno, raste i broj podatkovnih znanstvenika. Prema HH.ru, 246 stručnjaka za analizu podataka i 47 stručnjaka za strojno učenje svaki mjesec objavi svoje životopise.
Popis zahtjeva podnositelja zahtjeva također uključuje:
- znanje SQL-a;
- posjedovanje rudarenja podataka (Data Mining);
- pouzdano poznavanje matematičke statistike;
- sposobnost rada s velikim podacima;
- posjedovanje C ++, Git, Linux.
Istodobno, oko 65% slobodnih mjesta na polju analizepodaci i 50% slobodnih radnih mjesta stručnjaka iz područja strojnog učenja nalaze se u Moskvi. Sankt Peterburg zauzima drugo mjesto u Rusiji (15%, odnosno 18%). Naravno, tražitelji posla također su uglavnom koncentrirani u dva glavna grada. Ali danas, da biste prošli obuku, nije potrebno nekamo se preseliti, već rad u udaljenom formatu, na outsourcingu, već postaje novi format za organiziranje tijeka rada.
Gdje studirati za znanstvenika podataka i što je za to potrebno?
Postoji nekoliko pristupa učenju uznanstvenik podataka. Jedan od njih je klasičniji, za upis na sveučilište u IT područjima. To se može učiniti i u inozemstvu. Na primjer, studij magistra znanosti znanosti na američkom sveučilištu može vas koštati vrlo impresivnog iznosa: od 30 tisuća do 120 tisuća dolara. Čak i internetski tečajevi na stranim sveučilištima ove specijalnosti koštaju najmanje 9 tisuća dolara. Postoje i oni koji nisu spremni potrošite na svoj trening u takvom mjerilu, jer se takvi troškovi još uvijek moraju nadoknaditi, ali to se neće dogoditi odmah. Primjerice, znanstvenica podataka Rebecca Vickery, koja na ovom polju radi već 10 godina, stvorila je vlastiti program prema kojem je samostalno proučavala znanost o podacima. Ovaj pristup ima i svojih nedostataka: nedostatak povratnih informacija i podrške mentora ili učitelja, udaljenost od tima, rad samostalno i, konačno, mnogima je ovaj proces učenja dosadan.
Druga mogućnost je mrežni trening uspecijalizirane digitalne škole poput SkillFactory. Studente tamo ne samo da podučavaju niz tehnika i tehnika, već ih uče i učiti. Uz to, svaki će student imati mentora koji pruža potporu i pomoć, a sav posao odrađen u procesu učenja ne može se koristiti samo kao portfelj. Još dok je student SkillFactory-a, budući znanstvenik podataka ulazi u industrijsku zajednicu - to ne samo da pomaže naći posao, već i komunicirati s kolegama i podijeliti iskustva. Internetska škola uvjerena je da nije dovoljno samo naučiti nove tehnologije - trebate svladati nove pristupe i nove načine razmišljanja. I teško je nositi se s tim sam. Stoga svi učenici međusobno daju povratne informacije, razmjenjuju kod, pomažu u pronalaženju pogrešaka i dijeljenju zadataka i stvarnih slučajeva.
Što bi mlađi znanstvenik podataka trebao biti u stanju učiniti:
- koristiti osnovne algoritamske konstrukcije i Python strukture podataka za dizajniranje algoritama;
- vizualizirati podatke pomoću Pandas, Matplotlib, Seaborne;
- stvoriti modele industrijske kvalitete koristeći klasično strojno učenje i neuronske mreže za rješavanje problema znanosti znanosti;
- procijeniti kvalitetu modela (preciznost / opoziv);
- integrirati rješenje u proizvodnju i poslovanje općenito;
- rad sa skladištima podataka različitih vrsta;
- rad s alatima za analizu velikih podataka;
- primati podatke iz web izvora ili putem API-ja;
- primijeniti metode matematičke analize, linearne algebre, statistike i teorije vjerojatnosti za obradu podataka.
Ako vam se ove vještine čine vrlo teškima, možete pohađati tečajeve Data Scientist Profession.
Tko je znanstvenik podataka i što bi trebao moći učiniti?
U svojoj osnovi, Data Science je sljedeća"Evolucijski" korak čovječanstva u radu s podacima. Raniji matematičari i statističari rješavali su slične probleme. Sada su pojavom umjetne inteligencije optimizacija i računalne znanosti ušle u metode analize podataka, što znači da je novi pristup pronalaženju rješenja temeljenih na podacima postao mnogo učinkovitiji od prethodnih "analognih" metoda.
Posao znanstvenika podataka započinje sakupljanjemveliki skupovi podataka: strukturirani i ne. Tada se pretvaraju u format koji se lako čita. Sljedeća faza: vizualizacija i rad sa statistikama. Strojno i duboko učenje, probabilistička analiza, prediktivni modeli i neuronske mreže koriste se kao analitičke metode.

Pet osnova za znanstvenika podataka
- Umjetna inteligencija (AI) je područjeposvećen stvaranju inteligentnih sustava koji rade i ponašaju se poput ljudi. AI je povezan sa sličnim ciljem korištenja računala za razumijevanje ljudske inteligencije, ali nije nužno ograničen na biološki vjerojatne metode. Danas postojeći inteligentni sustavi imaju vrlo uska područja primjene. Na primjer, programi koji mogu pobijediti osobu u šahu ne mogu odgovoriti na pitanja.
- Strojno učenje -stvaranje alata za izdvajanje znanja iz podataka. ML modeli treniraju se na podacima neovisno ili u fazama: trening s učiteljem o podacima koje priprema osoba i bez učitelja - rad sa spontanim, bučnim podacima.
- Dubinsko učenje -izgradnja višeslojnih neuronskih mreža u područjima u kojima su potrebne naprednije ili brže analize, a tradicionalno strojno učenje zakazuje. "Dubinu" pruža niz skrivenih slojeva neurona u mreži koji izvode matematičke proračune.
- Veliki podaci - rad s velikimvolumen često nestrukturiranih podataka. Specifičnost kugle su alati i sustavi koji mogu izdržati velika opterećenja.
- Data Science - usrž područja je osnaživanje skupova podataka, vizualizacija, prikupljanje ideja i donošenje odluka na temelju tih podataka. Znanstvenici podataka koriste neke od metoda strojnog učenja i velikih podataka: računarstvo u oblaku, alate za stvaranje virtualnog razvojnog okruženja i još mnogo toga.
Kao i bilo koja druga profesija, i savladavanje podatakaZnanost započinje s osnovama - proučavanjem matematike, linearne algebre i naravno statistike. Za ozbiljno razumijevanje znanosti o znanosti, budućem će specijalistu trebati pravi sveučilišni tečaj teorije vjerojatnosti (uključujući računicu). Srećom, danas je takav materijal lako pronaći na Internetu ili se čak prijaviti za jedan semestar na najboljim sveučilištima u Rusiji na platformi Otvoreno obrazovanje. Ili pohađajte cjeloviti tečaj Data Science na SkillFactory, gdje će osnovno znanje biti prvi korak u svladavanju nove profesije. Matematičko znanje je prije svega važno za analizu rezultata primjene algoritama obrade podataka. Naravno, postoje jaki inženjeri u strojnom učenju bez takvog obrazovanja. Ali to su uglavnom rijetki slučajevi.
Drugi korak u postajanju znanstvenikom podataka je programiranje. Dovoljno je naučiti barem jedan jezik, svladavši sve nijanse njegove sintakse. Kao što je gore spomenuto, jedan od najtraženijih jezika je Python.
Strojno učenje - treća komponentaprofesija znanstvenika podataka, kada više ne treba pisati upute za računala za obavljanje određenih zadataka. ML se sastoji od tri glavna oblika: učenje pod nadzorom, učenje bez nadzora i učenje s pojačanjem. O svakoj vrsti treninga možete pročitati u našem velikom materijalu s profesorom Janom Lekunom.
I na kraju, posljednji korak je Data Mining (analizapodaci) i vizualizacija podataka, što je važan proces istraživanja i uključuje analizu skrivenih modela podataka u skladu s raznim opcijama za prevođenje u korisne informacije koje se prikupljaju i formiraju u skladištima podataka radi olakšavanja poslovnih odluka namijenjenih smanjenju troškova i povećanju prihoda.
Unatoč činjenici da se obrazovanje može steći uprilično kratkim vremenskim okvirima, znanstvenik podataka treba redovito potvrđivati svoje kvalifikacije, pohađajući visoko specijalizirane tečajeve, sudjelujući u hackathonovima, otvorenim natjecanjima i kad traži posao. Neovisna potvrda vaših kvalifikacija bit će prednost. Na primjer, napredni profil na Kaggleu, koji ima sustav rangova. Možete prijeći od početnika do velemajstora. Za uspješno sudjelovanje u natječajima, objavljivanje scenarija i rasprave dobivate bodove koji povećavaju vašu ocjenu. Uz to, stranica bilježi na kojim ste natjecanjima sudjelovali i kakvi su vaši rezultati.
primijeniti
Pogledajte i:
Pogledajte kamo sada leti rover Perseverance
Simptomi koronavirusa kod djece. Na što treba obratiti pažnju?
Astronomi vide kako crna rupa emitira trepereće gama zrake