Vaš vlastiti učitelj: kako algoritmi uče bez ljudske pomoći i čine dronove boljim

Bespilotna vozila, digitalni blizanci i automatizirana telekomunikacijska kontrola nisu

Pristupaju mu znanstvenici koji se bave primijenjenom umjetnom inteligencijom i istraživanjima u području učenja pojačanja.Hitech je govorio o budućnosti tehnologije s Olegom Svidchenkom, Alexanderom Grishinom i Aleksejem Shpilmanom, dobitnicima godišnje nagrade Segalovich.

Kako AI uči bez mentora

Učenje s pojačanjem,RL) pretpostavlja da sam AI stupa u interakciju s određenim okruženjem - na primjer, pločom za igru ​​Go ili vanjskim svijetom ako se robot kreće po njoj. Uređaj treba identificirati uobičajene obrasce i usredotočiti se na njih prilikom obavljanja zadataka. A kada učite s "učiteljicom", potrebna vam je osoba koja mora naznačiti ispravnu radnju na kojoj će AI trenirati.

“Suština RL-a je da stroj ili, kako mi kažemo,agent, uči u načinu stalne prakse”, napominje Oleg Svidchenko, laureat nagrade Yandex Science. - AI se stavlja u određene uvjete i "govori" - djeluje. To je slično situaciji kada miš krene u potragu za sirom u labirintu. Nakon što je skrenula u pogrešnom smjeru, životinja se sudara sa zidom, vraća se, pokušava ponovno i tako dalje. U slučaju učenja s pojačanjem, ispravni koraci se nagrađuju. Što je radnja ispravnija, više bodova će AI dobiti. Ako se ispostavi da je izbor netočan, agent gubi bodove. Tijekom treninga stroj pamti koja je kombinacija radnji bila isplativija i sljedeći put će je upotrijebiti.”

Neovisno traženje rješenja omogućuje agentuprije ili kasnije nadmašiti čovjeka. To je, na primjer, pokazao DeepMindov MuZero algoritam, koji je naučio igrati desetke starih Atari videoigara, šaha i društvenih igara tipa Go. Da bi ga stvorili, koristili su prethodni razvoj tvrtke: na primjer, AlphaGo, zahvaljujući kojem je bilo moguće pobijediti Go prvaka Leeja Sedola, i AlphaZero, koji se koristi u šahu. Poboljšani algoritam izvlači više informacija iz manje podataka - sada mu je potrebno pola koraka obuke.

Algoritmi učenja s pojačavanjem mogukorisno u raznim industrijama. Na primjer, u medicini - za organiziranje personaliziranog dinamičkog tretmana, u industriji zabave - za automatsko testiranje računalnih igrica, ili u zrakoplovstvu - za autonomno upravljanje stratosferskim balonom.

U kojim će područjima AI priskočiti u pomoć ljudima

Digitalizacija maloprodaje: potpuno automatizirane trgovine

Prvo strojno učenje implementirano je u industrijamagdje se ispravlja proces prikupljanja i digitalizacije velikih količina podataka. Primjerice, u maloprodaji sve informacije prolaze kroz blagajne, što znači da AI ima s čime raditi. Prema Alexeyju Shpilmanu, korištenje AI algoritama omogućit će stvaranje automatiziranih trgovina posvuda, gdje će se svi procesi odvijati bez ljudske intervencije.

Ovaj format je testiran još 2016. godine.Amazon tvrtka. Kupac uzima košaricu, preuzima robu u njoj i samo odlazi - novac za kupnju se automatski tereti s kartice. U Rusiji je sličan projekt razvila Azbuka Vkusa.

"Kupac uzima kolica, preuzima robu u njima i samo odlazi - novac za kupnju se automatski tereti s kartice"

Upravljanje telekomunikacijama: otkrivanje kvarova na mreži 

Zahvaljujući učenju s pojačanjemtehnološki pomaci mogu se dogoditi u upravljanju raznim mrežama - telekomunikacijama, mrežama grijanja, elektroprivrede. Mnoge je procese ovdje prilično lako robotizirati, budući da nema puno interakcije s ljudima.

Automatizacija će dovesti do sustava koji će donositi bolje odluke i optimizirati potrošnju energije.Na primjer, RL algoritmi koriste se za razvoj HVAC kontrolera (akronim zaEng. Grijanje, ventilacija i klimatizacija je sustav za kontrolu temperature i ventilacije prostorije.Korištenje ove tehnologije u poduzećima pomoći će i uštedjeti potrošnju energije i smanjiti emisije ugljika.

Bespilotna vozila: tehnologija ispitivanja i zakonodavstvo

Još jedno područje koje čeka iskorak zahvaljujućiučenje s pojačanjem – prijevoz. Već danas se na ulicama mogu naći bespilotna vozila i roboti za dostavu. Unatoč tehnološkom napretku u industriji, McKinseyjevi analitičari predviđaju da dronovi neće postati mainstream najranije 2030. godine. Provedba je komplicirana potrebom izrade propisa. U Singapuru i Sjedinjenim Državama automatizirani prijevoz već je u punom jeku autocestama, a nedavno se pojavilo i dopuštenje za testiranje bespilotnog taksija u Rusiji.

"Automatizacija gotovo uvijek povećava razinu sigurnosti, ali uvođenje takvih tehnologija zadovoljavaju ljudisa strahom", siguran je Oleg Svidchenko, " Ako se zamijeni sav prijevozna samovozećem Tesli broj nesreća na cestama smanjit će se nekoliko puta.Ali svaka nesreća će otvoriti mnoga pitanja.Ne možemo nedvosmisleno reći, kao u slučaju osobe, što je uzrokovalo nesreću.A ljudi su uplašeni ovom nepoznanicom."

“Još jedno područje koje čeka napredak zahvaljujući učenju s pojačanjem je transport”

Kako će digitalni blizanci biti korisni čovječanstvu

Algoritmi za učenje pojačanja omogućili su stvaranje digitalnih blizanaca - virtualnih prototipova objekata, procesa, pa čak i ljudi koji sadržeIma ista svojstva i karakteristike kao i originali.Ovu tehnologiju koriste industrijska poduzeća, na primjer, kako bi provjerila jesu li svi procesi ispravno otklonjeni prije lansiranja novog transportera.Naravno, utikač možete odmah priključiti u utičnicu, ali ako se to dogodiTrebat će vremena i resursa da se to popravi.prije pokretanja na računalu. 

Sve je puno bolje s ljudskim digitalnim blizancimateže, jer je živi organizam složeniji sustav. Pa ipak, znanstvenici nastavljaju svladavati tehnologiju, stvarajući virtualne kopije i pojedinih organa i cijelog organizma. Na primjer, bolnica u Bostonu koristi digitalni blizanac srca za planiranje operacija. U budućnosti će to omogućiti testiranje metoda liječenja na virtualnom pacijentu, predviđanje bolesti, a može se smatrati i revolucijom u medicini.

“Razvoj AI, uključujući RL, mogao bi dovesti dočinjenica da će ljudi početi bolje razumjeti sami sebe”, sugerira Aleksej Špilman. “Čovjek je zatvoren sustav, jer vlastiti mozak koristimo za samospoznaju. No, je li nam ovaj alat dovoljan? I u psihologiji su za promišljanje potrebne dvije osobe, a mi smo zatvoreni u sebi. Globalno, u kontekstu Svemira, čovječanstvo je još uvijek samo, što znači da nemamo s kim razgovarati kako bismo naučili nešto novo o sebi i sagledali izvana. Možda ćemo zahvaljujući učenju s pojačanjem stvoriti neku vrstu entiteta izvan nas samih. Neće biti ograničena našim mozgom i sviješću i moći će dati osobi nove odgovore i značenja.”

Zašto je raširena primjena RL-a još uvijek ograničena

Unatoč napretku znanstvenika, praktična primjena RL-a i dalje je ograničena.Sustavu treba dugo vremena da nauči, napravi mnogo pogrešaka, tako da je teško i neprofitabilno implementirati algoritam svugdje.

“Agentu je potrebno više ponavljanja, dakle procesučenje traje dosta dugo, - objašnjava Alexander Grishin - Štoviše, nije dovoljno da AI izvede najbolju akciju. Treba istražiti okolinu, jer se iza trenutno neatraktivnih poteza može skrivati ​​velika nagrada. Cijela logika učenja s pojačanjem svodi se na činjenicu da AI uči žrtvovati kratkoročne koristi za dugoročni uspjeh. Da biste to učinili, morate razmišljati unaprijed i izračunati moguće scenarije za razvoj događaja. Na primjer, kada agent odustane od viteza kako bi zarobio kraljicu, znanstvenici će biti vrlo sretni.”

Zadatak znanstvenika je osigurati da umjetna inteligencija poveća tempo učenja i poboljša svoju sposobnost analize.No, postoji jedan svakodnevni problem koji nas sprječava da brzo krenemo naprijed: nedostaje osoblja u laboratorijima za istraživanje i razvoj i IT tvrtkama.Sveučilišta stvaraju laboratorije i istraživačke centre, a tehnološki divovi otvaraju specijalizirane tečajeve.

“Istraživanje u strojnom učenju sadavrlo tražen. Industrija se ubrzano razvija, a nedostatak kadra svakim danom je sve veći”, kaže Alexey Shpilman. “Stručnjaci imaju veliku priliku uključiti se u procese koji će promijeniti svijet do neprepoznatljivosti. Puno zanimljivih radova. Sada smo na samom početku puta, ali već smo postigli dobre rezultate. Možete li zamisliti kakve će se izglede otvoriti čovječanstvu korištenjem RL-a?

Čitaj više:

Svemirska sonda je letjela 200 km od Merkura. Pogledaj što je vidio

Znanstvenici otkrivaju kako vitamini utječu na pojavu raka

Kineska kaciga za čitanje misli zvuči alarm kada osoba vidi porno sadržaj