Kenelle työskennellä datatieteessä ja mistä aloittaa

Nykyään tietotieteen asiantuntijoita tarvitaan lähes kaikilla liiketoiminnan aloilla. Kyse ei ole vain taloudellisesta

tai IT-yrityksiä. Datatieteilijät ovat kysyttyjä markkinoinnissa, myynnissä, tuotekehityksessä, johtamispäätöksissä, liikenteen ennustamisessa ja monimutkaisten teknologiajärjestelmien turvallisuuden varmistamisessa.

Datatieteen asiantuntijoiden kysyntä on erilainenpätevyys kasvaa vuosittain. Mail.ru Groupin MADE Big Data Academy -sivuston ja rekrytointiportaalin HeadHunterin mukaan tietojen analysoinnissa oli vuonna 2019 1,4 kertaa enemmän avoimia työpaikkoja kuin vuonna 2018. Ja koneoppimisen avoimien työpaikkojen määrä on kasvanut 1,3 kertaa.

Myös tutkijoiden tulot kasvavat. HH: n mukaan.ru, jopa nuorempi Venäjällä saa noin 120 tuhatta ruplaa, kun taas yritysanalyytikko voi jo luottaa 170 tuhanteen ruplaan ja enemmän, ja iso data-analyytikko - 200 tuhanteen ruplaan.

Kuka on kysytty ja miksi?

Useimmiten Venäjällä he etsivät datatieteilijöitärahoitus- ja IT-yritykset. Ja yleisin vaatimus hakijoille on Python-ohjelmointikielen tuntemus. Sitä esiintyy 45%: lla tietojenkäsittelyn työpaikoista ja lähes puolessa (51%) koneoppimisessa.

Tietysti myös datatieteilijöiden määrä kasvaa. HH.ru:n mukaan 246 data-analyysiasiantuntijaa ja 47 koneoppimisasiantuntijaa julkaisevat ansioluettelonsa kuukausittain.

Hakijoiden vaatimusten luettelo sisältää myös:

  • tieto SQL: stä;
  • tiedonlouhinnan hallinta (tiedonlouhinta);
  • luottavainen tieto matemaattisista tilastoista;
  • kyky työskennellä big datan kanssa;
  • hallussaan C ++, Git, Linux.

Samaan aikaan noin 65% analyysin avoimista työpaikoistatiedot ja 50% koneoppimisen asiantuntijoiden avoimista paikoista on Moskovassa. Pietari on toiseksi Venäjällä (vastaavasti 15% ja 18%). Tietysti myös työnhakijat ovat keskittyneet pääosin kahteen pääkaupunkiin. Mutta tänään koulutuksen suorittamiseksi ei ole välttämätöntä siirtyä jonnekin, mutta työskenteleminen etämuodossa ulkoistamisen kanssa on jo tulossa uudeksi muodoksi työnkulun organisoimiseksi.

Missä opiskella datatieteilijälle ja mitä tähän tarvitaan?

Sisään oppimiseen on useita lähestymistapojadatatieteilijä. Yksi heistä on klassisempi, päästä yliopistoon IT-alueilla. Tämä voidaan tehdä myös ulkomailla. Esimerkiksi tietojenkäsittelytieteen maisteriksi opiskelu yhdysvaltalaisessa yliopistossa voi maksaa erittäin vaikuttavan summan: 30–1 000 tuhatta dollaria. Jopa ulkomaisten yliopistojen verkkokurssit tällä erikoisalalla maksavat vähintään 9 tuhatta dollaria. On niitä, jotka eivät ole valmiita viettää harjoitteluusi niin suuressa mittakaavassa, koska kustannukset on vielä korvattava, mutta tämä ei tapahdu heti. Esimerkiksi tietojenkäsittelytieteiden tutkija Rebecca Vickery, joka on työskennellyt tällä alalla 10 vuotta, on luonut oman ohjelman, jonka mukaan hän opiskeli itsenäisesti datatiedettä. Tällä lähestymistavalla on myös haittansa: palautteen ja tuen puute mentorilta tai opettajalta, etäisyys tiimistä, yksin työskentely ja lopuksi monet pitävät tätä oppimisprosessia tylsänä.

Toinen vaihtoehto on verkkokoulutuserikoistuneet digitaaliset koulut, kuten SkillFactory. Opiskelijoita opetetaan paitsi joukko tekniikoita, myös opetetaan oppimaan. Lisäksi jokaisella opiskelijalla on mentori, joka tarjoaa tukea ja apua, ja kaikkea oppimisprosessissa tehtyä työtä ei voida käyttää vain portfoliona. Tuleva datatieteilijä tulee vielä SkillFactoryn opiskelijana teollisuusyhteisöön - tämä auttaa paitsi löytämään työtä, myös kommunikoimaan kollegoiden kanssa, jakamaan kokemuksia. Verkkokoulu on vakuuttunut siitä, että vain uuden tekniikan oppiminen ei riitä - sinun on opittava uudet lähestymistavat ja uudet ajattelutavat. Ja yksin on vaikea selviytyä siitä. Siksi kaikki opiskelijat antavat toisilleen palautetta, vaihtavat koodia, auttavat löytämään virheitä ja jakamaan ongelmia ja todellisia tapauksia.

Mitä Junior Data Scientistin pitäisi pystyä tekemään:

  • käyttää algoritmien perusrakenteita ja Python-tietorakenteita algoritmien suunnittelussa;
  • visualisoida tietoja käyttämällä Pandas, Matplotlib, Seaborne;
  • luoda teollisuuden laatumalleja käyttäen klassista koneoppimista ja hermoverkkoja datatieteen ongelmien ratkaisemiseksi;
  • arvioida mallin laatu (tarkkuus / palautus);
  • integroida ratkaisu tuotantoon ja liiketoimintaan yleensä;
  • työskennellä erityyppisten tietovarastojen kanssa;
  • työskennellä isojen tietojen analysointityökalujen kanssa;
  • vastaanottaa tietoja verkkolähteistä tai API: n kautta;
  • soveltaa matemaattisen analyysin, lineaarisen algebran, tilastojen ja todennäköisyysteorian menetelmiä tietojenkäsittelyyn.

Jos nämä taidot tuntuvat sinusta erittäin vaikeilta, voit suorittaa Data Scientist Profession -kursseja.

Kuka on datatieteilijä ja mitä hänen pitäisi pystyä tekemään?

Ytimessä Data Science on seuraava"Evoluutiomainen" ihmiskunnan vaihe tietojen käsittelyssä. Aikaisemmat matemaatikot ja tilastotieteilijät ratkaisivat samanlaisia ​​ongelmia. Tekoälyn myötä optimointi ja informatiikka ovat siirtyneet tietojen analysointimenetelmiin, mikä tarkoittaa, että uusi lähestymistapa dataan perustuvien ratkaisujen löytämiseen on tullut paljon tehokkaampi kuin aiemmat "analogiset" menetelmät.

Datatieteilijän työ alkaa keräämälläisot tietojoukot: jäsennelty ja ei. Sitten ne muunnetaan helposti luettavaan muotoon. Seuraava vaihe: visualisointi ja työskentely tilastojen kanssa. Kone- ja syväoppimista, todennäköisyysanalyysiä, ennustavia malleja ja hermoverkkoja käytetään analyyttisinä menetelminä.

Viisi perustetta datatieteilijälle

  • Tekoäly (AI) on alueomistettu älykkäiden järjestelmien luomiselle, jotka toimivat ja toimivat ihmisten tavoin. Tekoäly liittyy samankaltaiseen tavoitteeseen käyttää tietokoneita ihmisen älykkyyden ymmärtämiseen, mutta ei välttämättä rajoitu biologisesti uskottaviin menetelmiin. Nykyisin käytössä olevilla älykkäillä järjestelmillä on hyvin kapeat käyttöalueet. Esimerkiksi ohjelmat, jotka voivat voittaa henkilön shakissa, eivät voi vastata kysymyksiin.
  • Koneoppiminen -työkalun luominen tiedon keräämiseksi tiedoista. ML-mallit koulutetaan dataan itsenäisesti tai vaiheittain: kouluttaminen opettajan kanssa henkilön valmistamasta tiedosta ja ilman opettajaa - työskentely spontaanin, meluisen datan kanssa.
  • Syvä oppiminen -rakentaa monikerroksisia hermoverkkoja alueille, joilla tarvitaan edistyneempää tai nopeampaa analyysiä ja perinteinen koneoppiminen epäonnistuu. "Syvyyden" tarjoaa joukko piilotettuja verkon neuronikerroksia, jotka suorittavat matemaattisia laskelmia.
  • Big Data - työskentelee isojen kanssausein jäsentelemättömien tietojen määrä. Pallon erityispiirteet ovat työkalut ja järjestelmät, jotka kestävät suuria kuormia.
  • Tietojenkäsittely - sisäänkentän ydin on lisätä tietojoukkoja, visualisoida, kerätä ideoita ja tehdä päätöksiä näiden tietojen perusteella. Data-analyytikot käyttävät useita koneoppimista ja Big Data -tekniikoita: pilvipalveluja, työkaluja virtuaalisen kehitysympäristön luomiseen ja paljon muuta.

Kuten kaikki muutkin ammatit, myös Datan hallintaTiede alkaa perusasioista - matematiikan, lineaarisen algebran ja tietysti tilastojen tutkimuksesta. Jotta datatiede ymmärrettäisiin vakavasti, tuleva asiantuntija tarvitsee todellisen todennäköisyysteorian yliopistokurssin (mukaan lukien laskennan). Onneksi tällaisia ​​materiaaleja on tänään helppo löytää Internetistä tai jopa ilmoittautua lukukaudeksi Venäjän parhaisiin yliopistoihin Open Education -alustalla. Tai suorita täydellinen tietojenkurssi SkillFactorylla, jossa perustiedot ovat ensimmäinen askel uuden ammatin hallitsemisessa. Matemaattinen tieto on ensisijaisen tärkeää tietojenkäsittelyalgoritmien soveltamisen tulosten analysoimiseksi. Tietenkin koneoppimisessa on vahvoja insinöörejä ilman tällaista koulutusta. Mutta nämä ovat enimmäkseen harvinaisia ​​tapauksia.

Toinen vaihe tietotieteilijäksi tulemisessa on ohjelmointi. Riittää, kun opit ainakin yhden kielen, kun olet oppinut kaikki sen syntaksin vivahteet. Kuten edellä mainittiin, yksi suosituimmista kielistä on Python.

Koneoppiminen - kolmas osadatatieteilijän ammatti, kun hänen ei enää tarvitse kirjoittaa ohjeita tietokoneille tiettyjen tehtävien suorittamiseksi. ML koostuu kolmesta päämuodosta: ohjattu oppiminen, valvomaton oppiminen ja vahvistava oppiminen. Voit lukea lisää kustakin koulutustyypistä suuresta materiaalistamme professori Jan Lekunin kanssa.

Ja viimeinen vaihe on tiedonlouhinta (analyysidata) ja tietojen visualisointi, joka on tärkeä tutkimusprosessi ja joka sisältää piilotettujen tietomallien analysoinnin eri vaihtoehtojen mukaisesti hyödylliseksi tiedoksi muuntamiseksi, joka kerätään ja muodostetaan tietovarastoissa helpottamaan kustannusten alentamiseen ja tulojen kasvattamiseen tarkoitettuja liiketoimintaa koskevia päätöksiä.

Huolimatta siitä, että koulutusta voidaan saada vuonnamelko lyhyessä ajassa, datatieteilijän on vahvistettava pätevyytensä säännöllisesti, läpäisemällä pitkälle erikoistuneita kursseja, osallistumalla hakkeroihin, avoimiin kilpailuihin ja etsiessään töitä. Riippumaton vahvistus pätevyydestäsi on etu. Esimerkiksi Kagglen edistynyt profiili, jolla on sijoitusjärjestelmä. Voit siirtyä aloittelijasta suurmestariksi. Menestyksekkääseen osallistumiseen kilpailuihin, komentosarjojen julkaisemiseen ja keskusteluihin saat pisteitä, jotka lisäävät luokitustasi. Lisäksi sivusto ilmoittaa, missä kilpailuissa olet osallistunut ja mitkä ovat tulokset.

käyttää

Katso myös:

Katso, mihin Perseverance-rover lentää nyt

Koronaviruksen oireet lapsilla. Mihin sinun tulisi kiinnittää huomiota?

Tähtitieteilijät näkevät, kuinka musta reikä emittoi vilkkuvia gammasäteitä