Învățarea femeilor: fetele datasentist vorbesc despre învățarea mașinilor, despre creșterea carierei și tendințele

Oamenii de știință de date sunt experți în analiza datelor care au abilitățile tehnice pentru a rezolva probleme complexe

sarcini.Ei iubesc matematica, sunt aproape informaticieni, iubesc statisticile și, cel mai important, datele și analiza lor. În Rusia, potrivit Headhunter, salariul unui specialist în domeniul științei datelor și învățării automate poate ajunge la 300 de mii de ruble. Este clar că astfel de specialiști sunt la mare căutare și foarte bine plătiți pe piață.

Alexandra Murzina, Inginer Machine Learning, Grupul Tehnologii Avansate, Tehnologii Pozitive

Una dintre cele mai promițătoare tehnici dinÎnvățarea automată este acum învățare prin consolidare. Apropo, sistemul DeepMind, care a câștigat StarCraft II, se bazează pe acesta. Această abordare a învățării, și apoi a utilizării, amintește cu adevărat mai mult de AI. Un astfel de sistem este scufundat într-un mediu care îi oferă răspunsuri la acțiuni. Această metodă este foarte asemănătoare cu modul în care studiem tu și cu mine, dar uneori ne ia ani de zile, dar aici există o oportunitate de a accelera semnificativ procesul prin modelare și puterea computerului.

De exemplu, un astfel de sistem va învăța rapid "bineconduce o mașină. Desigur, vor rămâne probleme legate de situațiile excepționale și funcționarea sistemului în condițiile lor (datorită limitării sarcinilor pe care le rezolvă). În toamna anului 2017, rețelele neuronale capsulare nu au cauzat mai puțin zgomot: în acel moment au vorbit la fel de mult ca despre o revoluție în lumea învățării profunde. Astăzi aproape că au uitat de ei în public. În practică, încă sunt foarte populare arhitecturile de rețele și rețele neuronale, care au devenit deja standard pentru rezolvarea anumitor probleme. De exemplu, cum ar fi detectarea obiectelor în imagini sau clasificarea imaginilor.

Teoretic, AI ca o tehnologie va veni mai repedeacele domenii în care munca unei persoane constă în principal în acțiuni de rutină sau în domenii în care deciziile trebuie luate rapid pe baza unui volum mare de date. Adică, știrile senzaționale despre modul în care 600 de comercianți au fost înlocuiți cu două sute de programatori pot deveni cu ușurință unul dintre evenimentele obișnuite în domeniul automatizării. Revenind la industria cybersecurity, o astfel de automatizare este probabil, de exemplu, în domeniul analizei virusului sau a detectării atacurilor. Apropo, echipa noastră lucrează la o tehnologie care permite învățării mașinilor să detecteze atacurile pe aplicații web în câteva secunde.

În practică, prezicerea industriilor în care A.I.va fi solicitat pe scară largă în vigoare și în viitorul apropiat va fi dificil, deoarece utilizarea sa este asociată cu o mulțime de nuanțe sociale și juridice. Să zicem, pilot automat: din punct de vedere tehnologic este deja destul de posibil să se transfere zboruri standard către piloți automati, dar câți pasageri și-ar încrede viața într-un avion fără ca o persoană să stea la comenzi? Sau, să zicem, medicina – sunt multe evoluții bazate pe utilizarea AI în relație cu această industrie, dar din punct de vedere al cadrului legislativ nu pot fi folosite la maximum și astăzi rămân la nivel conceptual.

Da, există mult zgomot în jurul direcției:în același timp, mulți experți preferă să vorbească imediat despre rezolvarea unor probleme specifice, economisirea de timp și bani, sub rezerva utilizării tehnologiei. În realitate, aceste idei se poticnesc de problema personalului: dacă în urmă cu câțiva ani se vorbea despre o lipsă de programatori, atunci nimic nu s-a schimbat acum, doar că acum nu mai avem nevoie doar, de exemplu, de programatori Java, ci și de ingineri complecși, care poate înțelege și rezolva problema, inclusiv folosind metode de învățare automată.

Senzație de suprasaturare a pieței cu specialiștiÎnvățarea automată este mai înșelătoare decât reală. Da, mulți oameni cred că pot învăța rapid acest domeniu urmând câteva cursuri, dar, ca urmare, piața este suprasaturată cu specialiști cu un background irelevant. Cu toate acestea, învățarea automată este în cele mai multe cazuri un instrument pentru rezolvarea eficientă a unei probleme specifice (ei bine, doar dacă nu o faceți de dragul ei) și pentru a alege instrumentul potrivit trebuie să aveți o experiență vastă într-un anumit domeniu ( în cazul nostru, securitatea informațiilor) .

Istoria mașinilor de învățare de astăzi este mai multSe aseamănă cu situația cu antipatternul "ciocan de aur" popular în mediul de dezvoltare, în care orice problemă este încercată să fie rezolvată cu ajutorul unui ciocan unic (deși aur). Specialiștii în învățarea mașinilor care au terminat câteva cursuri își aplică experiența într-o suta de cazuri dintr-o sută, fără a putea înțelege când este necesar un alt set de instrumente - unul suplimentar. Mulți dintre acești specialiști proaspăt coapte nu sunt dezvoltatori și nu pot depăși cadrul Jupyter Notebook (un instrument popular în ML) sau nu dispun de cunoștințe adecvate în alte domenii, ceea ce nu le permite să utilizeze cu succes tehnologia într-o anumită zonă pentru a rezolva probleme specifice.

Alena Arykina, Data Scientist Sberbank PJSC

În procesul de învățare mecanică există o parte creativă,în funcție de datele și cunoștințele domeniului, de intuiția dezvoltatorului și de multe altele. Și există lucruri automate, unde trebuie să găsiți parametri mai buni și să rescrieți un cod cunoscut de mult timp. A doua parte, ca și în orice proces "mecanic", oamenii tind să optimizeze totul, inclusiv prin învățarea în mașină. Dacă matematicienii anteriori s-au mutat de la "învățarea manuală" la cea automată pe baza unor biblioteci ca keras, exemple de astfel de optimizări pot servi ca biblioteci pentru gestionarea stării seturilor de date, pentru preprocesarea imaginilor și a textelor, chiar și pentru detectarea automată a elementelor elementelor. Algoritmii pot fi simple (tăiați terminalele cuvintelor) sau complexe (construiți rețele neuronale speciale - autocodoare care comprimă date la orice dimensiune), dar un set de astfel de instrumente de formare determină cel mai adesea calitatea modelului final și, prin urmare, aptitudinile unui datassentist.

Învățarea în mașină va veni în cele din urmă în toatezone în care aceasta va fi încetinită de legislație sau de neîncredere umană: medicină sau o mașină cu un autopilot. Vedem deja realizări extraordinare în aceste domenii - ele sunt folosite în alte țări. Dar sunt sigur că, pentru a le pune în aplicare și a le face accesibile oamenilor obișnuiți, va trebui să câștigăm mai mult decât un război birocratic.

Știința datelor este într-adevăr foarte interesantă. În fiecare secundă, specialistul meu IT prieten a citit cel puțin despre învățarea în mașină. Willy-nilly, începeți să vă faceți griji: nu vor exista prea mulți datasintiști? În plus, acum încearcă să utilizeze învățarea în mașină în orice proiect IT și pentru orice sarcină, fără a-și imagina de ce există astfel de algoritmi acolo - este la modă. HYIP va trece și numărul locurilor vacante va scădea. Pe de altă parte, întrebarea este dacă cei care iubesc cu adevărat Data Science vor rămâne în profesie și nu vor urmări după modă.

Tatyana Savelyeva, șeful grupului de date nestructurat, Yandex.Taxi, autor al canalului telegramelor tldr_arxiv

Nu-mi place deloc cuvântul „AI”, pentru căeste prea general și ambițios și adesea îi determină pe oameni să supraestimeze nivelul tehnologiei. Știi, există o astfel de glumă: „Cum să distingem ML de AI? ML se face în Python, iar AI se face în PowerPoint.”

Prima tendință în domeniul științei datelor este în creșterepopularitatea domeniului subiectului: companiile realizează din ce în ce mai mult că fără a procesa o cantitate mare de informații utile în viitor, va fi dificil. Există o tendință către automatizarea învățării automate: dacă acum 10 ani trebuia să scrii toate metodele pentru a lucra singur, acum există multe biblioteci convenabile gata făcute.

Dar odată cu creșterea ușurinței de utilizare a metodelorinstrumentele actuale se schimbă din ce în ce mai repede - trebuie să țineți constant degetul pe puls. Există o tendință spre utilizarea rețelelor neuronale: conferințele industriale publică tot mai multe articole legate de acest tip de algoritmi.

Învățarea în mașină este ultimavor veni în zone unde nu există date sau unde nu sunt deloc - de exemplu, în acest fel nu puteți anticipa exact locul unde cade asteroidul sau momentul coliziunii Lunii cu Pământul. Se pare că învățarea în mașină este greu de implementat în instituțiile birocratice - agențiile guvernamentale, instituțiile medicale.

În orice caz, la un moment dat piața o va faceVa fi un număr mare de solicitanți pentru începerea posturilor vacante - specialiști juniori sau stagiari, pe măsură ce cunoștințele necesare angajării într-o astfel de poziție devin din ce în ce mai accesibile. Dar cererea de specialiști cu experiență care au implementat deja proiecte ML va crește, deoarece este nevoie de mult timp și efort pentru a câștiga această experiență, iar numărul de sarcini de învățare automată crește mai repede decât numărul de oameni care au avut timp și au fost. capabil să dobândească o astfel de experiență.

Emily Drahl, Analiza datelor Analytics, Mechanica AI, șeful Data Mining in Action

În învățarea mașinilor una dintre cele mai multetendințele luminoase sunt tranziția de la utilizarea sa ca tehnologie de asistență la automatizarea completă bazată pe aceasta. Acest lucru se manifestă cel mai bine în automatizarea producției industriale, agriculturii și agrobusiness-ului, precum și dezvoltarea conceptelor de oraș inteligent și de locuințe inteligente.

Acum, aplicații de învățare automatădestul de mult și acest lucru se datorează nivelului actual al dezvoltării stack-ului tehnologic, nivelului de înțelegere a domeniului și a unor probleme etice nerezolvate. Aplicația mea personală de top este medicina, psihologia și pedagogia. Aici nu este vorba în primul rând de servicii auxiliare (sisteme de recomandare pentru diagnosticarea bolilor sau de sisteme interactive), ci despre automatizarea completă a proceselor prin AI și ML.

Cred că industria IT azi este diferită pentru cătehnologiile se dezvoltă foarte dinamic și dacă nu mai respectați aceste schimbări, atunci există un risc foarte tangibil de a deveni un specialist nerevendic. Acesta este unul dintre puținele domenii în care absolvenții de universitate fără experiență pot concura cu profesioniști cu experiență.

Datorită pieței dinamice, lucrează pentru cei carePăstrează cu tendințele, va fi întotdeauna. Dar pentru cei care nu sunt pregătiți să-și învețe toată viața, întrebarea dificilă rămâne a fi rezolvată: cum să rămână relevantă. Aici veți ajuta experiența, perspectivele profesionale și cunoașterea domeniilor de activitate conexe (sau nu!).

Domeniul educației este în prezent în schimbareconceptual și, ca să spunem așa, se confruntă nu numai școlari și studenți, ci și profesioniști adulți cu experiență de lucru.Având o educație relevantă în trecut, un timp suficient și un nivel adecvat de perseverență, vă puteți recalifica fără investiții financiare semnificative și trece un interviu cel puțin pentru o poziție de nivel de intrare în analiza datelor. Acesta este unul dintre obiectivele cursurilor online.

Dacă vorbim despre universități, majoritateaîntâmpină o serie de dificultăți în predarea disciplinelor tehnice actuale: tehnologiile se schimbă foarte repede, este necesară atragerea de specialiști în exercițiu, iar aceștia nu sunt întotdeauna pregătiți să lucreze în formatul pe care îl presupune universitatea. Așa vin în ajutor companiile IT de vârf, creând școli, deschizând departamente la universități, desfășurând cursuri practice și stagii de practică și, de asemenea, formând absolvenții de ieri în cadrul companiei la începutul lucrului. În cele din urmă, eu personal văd sarcina unei universități nu numai și nu atât în ​​a elibera pe piață un specialist gata făcut, ci în faptul că învățământul superior ar trebui să ofere unei persoane un anumit nivel cultural, intelectual și emoțional, la care viața profesională depinde în mare măsură mai degrabă decât de cunoașterea unor tehnologii specifice.

Anna Voevodskaya, expert în învățarea mașinilor, Jet Infosystems

Mi se pare că acum ei se aplică tot mai mult.consolidarea învățării. Decizia de a învăța, de a interacționa cu mediul, folosind recompense, acțiuni și observații. Unul dintre cele mai cunoscute exemple de învățare a armăturilor este AlphaGo. De asemenea, astfel de metode de instruire sunt folosite pentru a simula mișcarea unei persoane (ultimele concursuri la NIPS au fost despre RL), mașini și altele.

Învățarea automată este magie la maxim.sens. Matematică destul de complexă este aplicată în mod specific datelor tale, se face o analiză aprofundată și se emite o prognoză foarte precisă doar pentru tine. Și toată lumea își dorește această magie pentru ei înșiși: face bani și este bună pentru imaginea lor - grozav.

În ceea ce privește pătrunderea pieței, mă aflu în astaNu cred. Buni specialisti sunt intotdeauna greu de gasit. De exemplu, Java nu a apărut acum doi ani, dar senior este încă greu de găsit în acest domeniu. Și un datasaytnist bun este, în general, unicorn: el știe și iubește matematica, kodit și înțelege metrici de afaceri și explică totul bine. Dacă avem o sursă excesivă de astfel de oameni la un moment dat în lume, va fi frumos. Dar acesta este un fel de utopie.