Kam strādāt datu zinātnē un ar ko sākt

Mūsdienās datu zinātnes speciālisti ir nepieciešami gandrīz visās uzņēmējdarbības jomās. Runa nav tikai par finansēm

vai IT uzņēmumiem. Datu zinātnieki ir pieprasīti mārketingā, pārdošanā, produktu attīstībā, vadības lēmumos, trafika prognozēšanā un sarežģītu tehnoloģiju sistēmu drošības nodrošināšanā.

Pieprasījums pēc datu zinātnes speciālistiem ir atšķirīgskvalifikācija katru gadu pieaug. Saskaņā ar MADE Big Data Academy no Mail.ru Group un personāla atlases portāla HeadHunter datiem 2019. gadā datu analīzes jomā bija 1,4 reizes vairāk vakanču nekā 2018. gadā. Mašīnmācības jomā vakanču skaits ir pieaudzis 1,3 reizes.

Pieaug arī datu zinātnieku ienākumi. Saskaņā ar HH.ru, pat juniors Krievijā saņem aptuveni 120 tūkstošus rubļu, savukārt biznesa analītiķis jau var rēķināties ar 170 tūkstošiem un vairāk, bet lielo datu analītiķis - no 200 tūkstošiem rubļu.

Kas ir pieprasīts un kāpēc?

Visbiežāk Krievijā viņi meklē datu zinātniekusfinanšu un IT uzņēmumi. Visizplatītākā prasība pretendentiem ir zināšanas par Python programmēšanas valodu. Tas notiek 45% datu zinātnes darba vietu un gandrīz pusei (51%) mašīnmācībā.

Protams, pieaug arī datu zinātnieku skaits. Saskaņā ar HH.ru datiem 246 datu analīzes speciālisti un 47 mašīnmācīšanās speciālisti katru mēnesi publicē savus CV.

Pretendentu prasību sarakstā ir arī:

  • zināšanas par SQL;
  • datu ieguves rīcībā (Data Mining);
  • pārliecinātas zināšanas par matemātisko statistiku;
  • spēja strādāt ar lielajiem datiem;
  • C ++, Git, Linux īpašumā.

Tajā pašā laikā aptuveni 65% vakanču analīzes jomādati un 50% no mašīnmācības jomas speciālistu vakancēm atrodas Maskavā. Sanktpēterburga ieņem otro vietu Krievijā (attiecīgi 15% un 18%). Protams, darba meklētāji arī galvenokārt koncentrējas abās galvaspilsētās. Bet šodien, lai izietu apmācību, nav nepieciešams kaut kur pārcelties, bet darbs attālinātā formātā, izmantojot ārpakalpojumus, jau kļūst par jaunu darba plūsmas organizēšanas formātu.

Kur mācīties datu zinātniekam un kas tam nepieciešams?

Ir vairākas pieejas mācībāmdatu zinātnieks. Viens no tiem ir klasiskāks, lai iestātos universitātē IT jomās. To var izdarīt arī ārzemēs. Piemēram, studijas datu zinātņu maģistrantūrā Amerikas universitātē jums var maksāt ļoti iespaidīgu summu: no 30 tūkstošiem līdz 120 tūkstošiem dolāru. Pat tiešsaistes kursi ārvalstu universitātēs šajā specialitātē maksā vismaz 9 tūkstošus dolāru. Ir arī tādi, kas nav gatavi iztērējiet savas apmācības tādā apjomā, jo šādas izmaksas vēl ir jāatlīdzina, taču tas nenotiks uzreiz. Piemēram, datu zinātniece Rebeka Vikeri, kura šajā jomā strādā jau 10 gadus, ir izveidojusi savu programmu, saskaņā ar kuru viņa patstāvīgi studēja Datu zinātni. Šai pieejai ir arī savi trūkumi: atsauksmes un mentora vai skolotāja atbalsta trūkums, attālums no komandas, darbs vienatnē, un, visbeidzot, daudziem šis mācību process šķiet garlaicīgs.

Vēl viena iespēja ir tiešsaistes apmācībaspecializētās digitālās skolas, piemēram, SkillFactory. Tur esošajiem studentiem tiek mācīti ne tikai paņēmieni un paņēmieni, bet arī iemācīti mācīties. Turklāt katram studentam būs padomdevējs, kurš sniedz atbalstu un palīdzību, un visu mācību procesā paveikto darbu var izmantot ne tikai kā portfolio. Būdams vēl SkillFactory students, topošais datu zinātnieks ienāk nozares sabiedrībā - tas palīdz ne tikai atrast darbu, bet arī sazināties ar kolēģiem un dalīties pieredzē. Tiešsaistes skola ir pārliecināta, ka nepietiek tikai ar jaunu tehnoloģiju apgūšanu - jums jāapgūst jaunas pieejas un jauni domāšanas veidi. Un vienatnē ar to ir grūti tikt galā. Tāpēc visi studenti sniedz viens otram atsauksmes, apmainās ar kodu, palīdz atrast kļūdas un dalīties ar problēmām un reāliem gadījumiem.

Kas jāspēj jaunākajam datu zinātniekam:

  • algoritmu projektēšanai izmantot pamata algoritmiskās konstrukcijas un Python datu struktūras;
  • vizualizēt datus, izmantojot Pandas, Matplotlib, Seaborne;
  • izveidot rūpnieciskas kvalitātes modeļus, izmantojot klasiskās mašīnmācības un neironu tīklus, lai atrisinātu Data Science problēmas;
  • novērtēt modeļa kvalitāti (precizitāte / atsaukšana);
  • integrēt risinājumu ražošanā un uzņēmējdarbībā kopumā;
  • strādāt ar dažāda veida datu noliktavām;
  • strādāt ar lielo datu analīzes rīkiem;
  • saņemt datus no tīmekļa avotiem vai caur API;
  • datu apstrādei pielietot matemātiskās analīzes, lineārās algebras, statistikas un varbūtību teorijas metodes.

Ja šīs prasmes tev šķiet ļoti sarežģītas, tad vari apgūt Datu zinātnieka profesijas kursus.

Kas ir datu zinātnieks un ko viņam vajadzētu darīt?

Datu zinātne savā pamatā ir nākamā"Evolūcijas" cilvēces solis darbā ar datiem. Iepriekšējie matemātiķi un statistiķi atrisināja līdzīgas problēmas. Tagad, iestājoties mākslīgajam intelektam, datu analīzes metodēs ir ieviesta optimizācija un informātika, kas nozīmē, ka jauna pieeja risinājumu meklēšanai, pamatojoties uz datiem, ir kļuvusi daudz efektīvāka nekā iepriekšējās "analogās" metodes.

Datu zinātnieka darbs sākas ar vākšanulielas datu kopas: strukturētas un ne. Tad tie tiek pārveidoti viegli lasāmā formātā. Nākamais posms: vizualizācija un darbs ar statistiku. Mašīniskā un dziļā mācīšanās, varbūtības analīze, prediktīvie modeļi un neironu tīkli tiek izmantoti kā analītiskās metodes.

Piecas bāzes datu zinātniekam

  • Mākslīgais intelekts (AI) ir jomaveltīts tādu inteliģentu sistēmu radīšanai, kuras darbojas un darbojas kā cilvēki. AI ir saistīts ar līdzīgu datoru izmantošanas mērķi cilvēka inteliģences izpratnei, taču tas ne tikai aprobežojas ar bioloģiski ticamām metodēm. Mūsdienās pastāvošajām inteliģentajām sistēmām ir ļoti šauras pielietošanas jomas. Piemēram, programmas, kas var pieveikt cilvēku šahā, nevar atbildēt uz jautājumiem.
  • Mašīnmācība -rīka izveide zināšanu iegūšanai no datiem. ML modeļi tiek apmācīti par datiem neatkarīgi vai pakāpeniski: apmācība pie skolotāja par personas sagatavotiem datiem un bez skolotāja - darbs ar spontāniem, trokšņainiem datiem.
  • Dziļa mācīšanās -veidot daudzslāņu neironu tīklus vietās, kur nepieciešama uzlabota vai ātrāka analīze un tradicionālā mašīnmācīšanās neizdodas. "Dziļumu" nodrošina vairāki slēpti tīkla neironu slāņi, kas veic matemātiskus aprēķinus.
  • Big Data - darbs ar lielubieži nestrukturētu datu apjoms. Sfēras specifika ir instrumenti un sistēmas, kas iztur lielas slodzes.
  • Datu zinātne - inlauka kodols ir pilnvarot datu kopas, vizualizēt, apkopot idejas un pieņemt lēmumus, pamatojoties uz šiem datiem. Datu analītiķi izmanto vairākas mašīnmācīšanās un lielo datu metodes: mākoņdatošanu, virtuālās izstrādes vides izveides rīkus un daudz ko citu.

Tāpat kā jebkura cita profesija, arī datu pārzināšanaZinātne sākas ar pamatiem - matemātikas, lineārās algebras un, protams, statistikas izpēti. Lai nopietni izprastu datu zinātni, nākotnes speciālistam būs nepieciešams reāls universitātes kurss varbūtību teorijā (ieskaitot aprēķinu). Par laimi, šodien šādus materiālus ir viegli atrast internetā vai pat reģistrēties uz vienu semestri Krievijas labākajās universitātēs platformā Open Education. Vai arī iziet pilnu Datu zinātnes kursu SkillFactory, kur pamatzināšanas būs pirmais solis jaunas profesijas apgūšanā. Matemātiskās zināšanas ir galvenokārt svarīgas, lai analizētu datu apstrādes algoritmu izmantošanas rezultātus. Protams, mašīnmācībā ir spēcīgi inženieri bez šādas izglītības. Bet tie pārsvarā ir reti gadījumi.

Otrais solis, lai kļūtu par datu zinātnieku, ir programmēšana. Pietiek, ja apgūstat vismaz vienu valodu, apgūstot visas tās sintakses nianses. Kā minēts iepriekš, viena no populārākajām valodām ir Python.

Mašīnmācība - trešā sastāvdaļadatu zinātnieka profesija, kad viņam vairs nav jāraksta instrukcijas datoriem noteiktu uzdevumu veikšanai. ML ir trīs galvenās formas: uzraudzīta mācīšanās, bez uzraudzības un mācīšanās pastiprināšana. Plašāku informāciju par katru apmācības veidu varat izlasīt mūsu lielajā materiālā ar profesoru Janu Lekunu.

Visbeidzot, pēdējais solis ir datu ieguve (analīzedati) un datu vizualizācija, kas ir svarīgs izpētes process un ietver slēpto datu modeļu analīzi saskaņā ar dažādām iespējām pārveidot noderīgu informāciju, kas tiek savākta un veidota datu noliktavās, lai atvieglotu uzņēmējdarbības lēmumus, kuru mērķis ir samazināt izmaksas un palielināt ienākumus.

Neskatoties uz to, ka izglītību var iegūtdiezgan īsā laika posmā datu zinātniekam regulāri jāapstiprina sava kvalifikācija, jānokārto ļoti specializēti kursi, jāpiedalās hakatonos, atklātajos konkursos un meklējot darbā. Neatkarīga kvalifikācijas apstiprināšana būs priekšrocība. Piemēram, Kaggle papildu profils, kuram ir rangu sistēma. Jūs varat pāriet no iesācēja uz lielmeistaru. Par veiksmīgu dalību konkursos, scenāriju un diskusiju publicēšanu jūs saņemat punktus, kas paaugstina jūsu reitingu. Turklāt vietne atzīmē, kurās sacensībās jūs piedalījāties un kādi ir jūsu rezultāti.

Piesakies

Skatiet arī:

Skatiet, kur tagad lido neatlaidības braucējs

Koronavīrusa simptomi bērniem. Kas jums vajadzētu pievērst uzmanību?

Astronomi redz, kā melnais caurums izstaro mirgojošus gamma starus