Cine să lucreze în știința datelor și de unde să începeți

Astăzi, este nevoie de specialiști în știința datelor în aproape toate domeniile de afaceri. Nu este vorba doar despre financiar

Experții în date sunt solicitați în marketing, vânzări, dezvoltarea produselor, deciziile de management, predicția traficului și asigurarea securității sistemelor tehnologice complexe.

Cererea de specialiști în știința datelor este diferităcalificările cresc în fiecare an. Potrivit Academiei MADE Big Data de la Mail.ru Group și a portalului de recrutare HeadHunter, în 2019 au existat de 1,4 ori mai multe posturi vacante în domeniul analizei datelor comparativ cu 2018. Și numărul locurilor de muncă vacante în domeniul învățării automate a crescut de 1,3 ori.

Câștigurile oamenilor de știință de date sunt, de asemenea, în creștere. Potrivit lui HH.ru, chiar și un junior din Rusia primește aproximativ 120 de mii de ruble, în timp ce un analist de afaceri se poate baza deja pe 170 de mii de ruble și mai mult, iar un analist de date mari - de la 200 de mii de ruble.

Cine este în căutare și de ce?

Cel mai adesea în Rusia caută oameni de știință de datecompanii financiare și IT. Iar cea mai comună cerință pentru solicitanți este cunoașterea limbajului de programare Python. Apare în 45% din locurile de muncă în domeniul științei datelor și în aproape jumătate (51%) în învățarea automată.

Desigur, numărul cercetătorilor de date este, de asemenea, în creștere. Potrivit HH.ru, 246 de specialiști în analiza datelor și 47 de specialiști în învățare automată își postează CV-urile în fiecare lună.

Lista cerințelor de la solicitanți include, de asemenea:

  • cunoașterea SQL;
  • deținerea exploatării de date (Data Mining);
  • cunoașterea încrezătoare a statisticilor matematice;
  • capacitatea de a lucra cu date mari;
  • posesia C ++, Git, Linux.

În același timp, aproximativ 65% din posturile vacante din domeniul analizeidatele și 50% din posturile vacante de specialiști în domeniul învățării automate se află la Moscova. Sankt Petersburg ocupă locul al doilea în Rusia (15%, respectiv 18%). Desigur, solicitanții sunt, de asemenea, concentrați în principal în cele două capitale. Dar astăzi, pentru a urma o pregătire, nu este necesar să vă mutați undeva, ci să lucrați într-un format de la distanță, la externalizare, devine deja un nou format pentru organizarea fluxului de lucru.

Unde să studiezi pentru un om de știință de date și ce este necesar pentru asta?

Există mai multe abordări ale învățării încercetător în date. Una dintre ele este una mai clasică, pentru a intra într-o universitate în domeniile IT. Acest lucru se poate face și în străinătate. De exemplu, studierea pentru un master în știința datelor la o universitate americană vă poate costa o sumă foarte impresionantă: de la 30 mii dolari până la 120 mii dolari. Chiar și cursurile online din această specialitate la universitățile străine costă cel puțin 9 mii dolari. cheltuiți pentru instruirea dvs. la o astfel de scară, deoarece astfel de costuri trebuie încă recuperate, dar acest lucru nu se va întâmpla imediat. De exemplu, cercetătoarea de date Rebecca Vickery, care lucrează în acest domeniu de 10 ani, și-a creat propriul program, potrivit căruia a studiat independent Știința datelor. Această abordare are și dezavantajele sale: lipsa de feedback și sprijin din partea unui mentor sau profesor, distanța față de echipă, lucrul singur și, în cele din urmă, mulți consideră acest proces de învățare plictisitor.

O altă opțiune este formarea online înșcoli digitale specializate precum SkillFactory. Elevii de acolo nu sunt învățați doar un set de tehnici și tehnici, ci și învățați să învețe. În plus, fiecare student va avea un mentor care oferă sprijin și asistență, iar toată munca depusă în procesul de învățare nu poate fi utilizată doar ca portofoliu. În timp ce încă este student la SkillFactory, viitorul om de știință al datelor intră în comunitatea din industrie - acest lucru nu numai că ajută la găsirea unui loc de muncă, ci și la comunicarea cu colegii și la schimbul de experiență. Școala online este convinsă că nu este suficient doar să înveți noi tehnologii - trebuie să stăpânești noi abordări și noi moduri de gândire. Și este dificil să faci față singur. Prin urmare, toți elevii își oferă reciproc feedback, schimb de cod, ajută la găsirea erorilor și la partajarea sarcinilor și a cazurilor reale.

Ce ar trebui să poată face un Junior Data Scientist:

  • utilizați construcții algoritmice de bază și structuri de date Python pentru a proiecta algoritmi;
  • vizualizați datele folosind Pandas, Matplotlib, Seaborne;
  • Creați modele de calitate industrială folosind învățarea automată clasică și rețelele neuronale pentru a rezolva problemele științei datelor;
  • evaluați calitatea modelului (precizie / rechemare);
  • să integreze soluția în producție și în afaceri în general;
  • lucrați cu depozite de date de diferite tipuri;
  • lucrați cu instrumente de analiză a datelor mari;
  • primiți date din surse web sau prin API;
  • aplica metode de analiză matematică, algebră liniară, statistici și teoria probabilității pentru prelucrarea datelor.

Dacă aceste abilități ți se par foarte dificile, atunci poți urma cursurile Data Scientist Profession.

Cine este un om de știință al datelor și ce ar trebui să poată face?

La bază, Data Science este următoareaPasul „evolutiv” al umanității în lucrul cu datele. Matematicienii și statisticienii anteriori au rezolvat probleme similare. Acum, odată cu apariția inteligenței artificiale, optimizarea și informatica au intrat în metodele de analiză a datelor, ceea ce înseamnă că o nouă abordare a găsirii soluțiilor bazate pe date a devenit mult mai eficientă decât metodele „analogice” anterioare.

Slujba unui om de știință a datelor începe cu colectareaseturi de date mari: structurate și nu. Apoi, acestea sunt convertite într-un format ușor de citit. Următoarea etapă: vizualizarea și lucrul cu statistici. Învățarea automată și profundă, analiza probabilistică, modelele predictive și rețelele neuronale sunt utilizate ca metode analitice.

Cinci baze pentru un om de știință al datelor

  • Inteligența artificială (AI) este o zonădedicat creării de sisteme inteligente care funcționează și acționează ca oamenii. AI este legată de obiectivul similar al utilizării computerelor pentru a înțelege inteligența umană, dar nu se limitează neapărat la metode plauzibile biologic. Sistemele inteligente existente astăzi au domenii de aplicare foarte înguste. De exemplu, programele care pot bate o persoană la șah nu pot răspunde la întrebări.
  • Învățare automată -crearea unui instrument pentru extragerea cunoștințelor din date. Modelele ML sunt instruite cu privire la date în mod independent sau în etape: instruirea cu un profesor cu privire la datele pregătite de o persoană și fără un profesor - lucrul cu date spontane, zgomotoase.
  • Invatare profunda -construirea de rețele neuronale multistrat în zone în care este necesară o analiză mai avansată sau mai rapidă și eșecul învățării automate tradiționale. „Adâncimea” este asigurată de un număr de straturi ascunse de neuroni din rețea care efectuează calcule matematice.
  • Big Data - lucrul cu bigvolumul de date deseori nestructurate. Specificitatea sferei este instrumentele și sistemele care pot rezista la sarcini mari.
  • Știința datelor - înnucleul zonei este împuternicirea seturilor de date, vizualizarea, colectarea de idei și luarea deciziilor pe baza acestor date. Analiștii de date folosesc o serie de metode de învățare automată și Big Data: cloud computing, instrumente pentru crearea unui mediu de dezvoltare virtual și multe altele.

Ca orice altă profesie, stăpânirea datelorȘtiința începe cu elementele de bază - studiul matematicii, algebrei liniare și, desigur, statisticii. Pentru o înțelegere serioasă a științei datelor, un viitor specialist va avea nevoie de un curs universitar real în teoria probabilităților (inclusiv calculul). Din fericire, astăzi astfel de materiale sunt ușor de găsit pe Internet sau chiar se pot înscrie pentru un semestru la cele mai bune universități din Rusia pe platforma Open Education. Sau urmați cursul complet de Știința datelor la SkillFactory, unde cunoștințele de bază vor fi primul pas în însușirea unei noi profesii. În primul rând, cunoștințele matematice sunt importante pentru a analiza rezultatele aplicării algoritmilor de procesare a datelor. Desigur, există ingineri puternici în învățarea automată fără o astfel de educație. Dar acestea sunt în majoritate cazuri rare.

Al doilea pas în a deveni cercetător în date este programarea. Este suficient să înveți cel puțin o limbă, după ce stăpânești toate nuanțele sintaxei sale. După cum sa menționat mai sus, una dintre limbile cele mai solicitate este Python.

Învățarea automată - a treia componentăprofesie de om de știință a datelor, când nu mai are nevoie să scrie instrucțiuni pentru computere pentru a îndeplini anumite sarcini. ML constă din trei forme principale: învățare supravegheată, învățare nesupravegheată și învățare de consolidare. Puteți citi mai multe despre fiecare tip de instruire în materialul nostru amplu alături de profesorul Jan Lekun.

Și, în sfârșit, ultimul pas este Data Mining (analizădate) și vizualizarea datelor, care este un proces important de cercetare și implică analiza modelelor de date ascunse în conformitate cu diferite opțiuni de traducere în informații utile care sunt colectate și formate în depozite de date pentru a facilita deciziile de afaceri concepute pentru a reduce costurile și a crește veniturile.

În ciuda faptului că educația poate fi obținută înperioade destul de scurte, un om de știință al datelor trebuie să-și confirme calificările în mod regulat, promovând cursuri foarte specializate, participând la hackatoni, concursuri deschise și atunci când caută la locul de muncă. Confirmarea independentă a calificărilor dvs. va fi un avantaj. De exemplu, profilul avansat de pe Kaggle, care are un sistem de rang. Puteți trece de la începător la mare maestru. Pentru participarea cu succes la concursuri, publicarea de scripturi și discuții, primiți puncte care vă cresc ratingul. În plus, site-ul notează la ce competiții ați participat și care sunt rezultatele dvs.

aplica

Vezi și:

Vedeți unde zboară roverul Perseverance acum

Simptomele coronavirusului la copii. La ce ar trebui să acorde atenție?

Astronomii văd cum o gaură neagră emite raze gamma pâlpâitoare