Oma opettajasi: kuinka algoritmit oppivat ilman ihmisen apua ja tekevät droneista parempia

Miehittämättömät ajoneuvot, digitaaliset kaksoset ja automaattinen tietoliikenteen ohjaus eivät ole

tieteiskirjailijoiden ennustukset ja joLähitulevaisuudessa. Sitä tuovat lähemmäksi tutkijat, jotka harjoittavat soveltavaa tekoälyä ja tutkimusta vahvistusoppimisen alalla. Hi-Tech puhui teknologian tulevaisuudesta vuosittaisen Segalovich-palkinnon voittajien Oleg Svidchenkon, Alexander Grishinin ja Alexey Shpilmanin kanssa.

Kuinka tekoäly oppii ilman mentoria

Vahvistusoppiminen,RL) olettaa, että tekoäly itse on vuorovaikutuksessa tietyn ympäristön kanssa - esimerkiksi Go-pelin laudan tai ulkomaailman kanssa, jos robotti liikkuu sitä pitkin. Laitteen on tunnistettava yleiset kuviot ja keskityttävä niihin tehtäviä suorittaessaan. Ja kun opit "opettajan" kanssa, tarvitset henkilön, jonka on osoitettava oikea toiminta, jolla tekoäly harjoittelee.

"RL:n ydin on, että kone tai, kuten sanomme,agentti, oppii jatkuvan harjoittelun muodossa”, toteaa Yandexin tiedepalkinnon saaja Oleg Svidchenko. - AI asetetaan tiettyihin olosuhteisiin ja "puhu" - toimi. Tämä on samanlainen tilanne, kun hiiri lähtee etsimään juustoa sokkelosta. Käännettyään väärään suuntaan eläin törmää seinään, palaa takaisin, yrittää uudelleen ja niin edelleen. Vahvistusoppimisessa oikeat askeleet palkitaan. Mitä oikeampi toiminta, sitä enemmän pisteitä tekoäly saa. Jos valinta osoittautui vääräksi, agentti menettää pisteitä. Harjoittelun aikana kone muistaa, mikä toimintojen yhdistelmä oli kannattavampi, ja seuraavan kerran se käyttää sitä.”

Riippumaton ratkaisun etsiminen mahdollistaa agentinennemmin tai myöhemmin ylittää miehen. Tämän osoitti esimerkiksi DeepMindin MuZero-algoritmi, joka oppi pelaamaan kymmeniä vanhoja Atari-videopelejä, shakkia ja Go-tyyppisiä lautapelejä. Sen luomiseen he käyttivät yrityksen aiempaa kehitystä: esimerkiksi AlphaGoa, jonka ansiosta oli mahdollista voittaa Go-mestari Lee Sedol, ja AlphaZeroa, jota käytetään shakissa. Parannettu algoritmi poimii enemmän tietoa pienemmästä datasta - nyt se tarvitsee puolet koulutusvaiheista.

Vahvistavat oppimisalgoritmit voivathyödyllinen monilla toimialoilla. Esimerkiksi lääketieteessä - henkilökohtaisen dynaamisen hoidon järjestämiseen, viihdeteollisuudessa - tietokonepelien automaattiseen testaukseen tai ilmailussa - stratosfäärin ilmapallon autonomiseen ohjaukseen.

Millä alueilla tekoäly tulee ihmisten avuksi

Vähittäiskaupan digitalisointi: täysin automatisoidut myymälät

Ensimmäinen koneoppiminen on otettu käyttöön teollisuudessajossa suurten tietomäärien keräämis- ja digitointiprosessissa tehdään virheenkorjaus. Esimerkiksi vähittäiskaupassa kaikki tieto kulkee kassakoneiden kautta, mikä tarkoittaa, että tekoälyllä on tekemistä. Alexey Shpilmanin mukaan tekoälyalgoritmien käyttö mahdollistaa automatisoitujen myymälöiden luomisen kaikkialle, joissa kaikki prosessit tapahtuvat ilman ihmisen puuttumista.

Tätä muotoa testattiin vuonna 2016.Amazon yritys. Ostaja ottaa kärryn, noutaa tavarat siihen ja lähtee vain - oston rahat veloitetaan kortilta automaattisesti. Venäjällä samanlaisen projektin kehitti Azbuka Vkusa.

"Ostaja ottaa vaunun, noutaa tavarat siihen ja lähtee vain - oston rahat veloitetaan kortilta automaattisesti"

Tietoliikenteen hallinta: verkkovikojen tunnistaminen 

Vahvistusoppimisen ansiostateknologisia läpimurtoja voi tapahtua erilaisten verkkojen hallinnassa - tietoliikenne, lämpöverkot, sähköteollisuus. Monet prosessit täällä ovat melko helppoja robotisoida, koska ihmisten kanssa ei ole paljon vuorovaikutusta.

Automatisointi johtaa järjestelmien luomiseentekee tietoisempia päätöksiä ja optimoi energiankulutuksen. Esimerkiksi RL-algoritmeihin perustuen kehitetään LVI-ohjainta (lyhenne sanoista Heating, Ventilation, & Air Conditioning - Heating, ventilation and airconditioning) - tämä on huonelämpötilan ja ilmanvaihdon ohjausjärjestelmä. Tämän teknologian käyttäminen yrityksissä auttaa sekä säästämään energiankulutusta että vähentämään hiilidioksidipäästöjä.

Miehittämättömät ajoneuvot: testaustekniikka ja lainsäädäntö

Toinen alue, joka odottaa läpimurtoa kiitosvahvistusoppiminen - kuljetus. Jo nykyään kaduilta löytyy miehittämättömiä ajoneuvoja ja jakelurobotteja. Huolimatta alan teknologisesta kehityksestä, McKinseyn analyytikot ennustavat, että droneista tulee valtavirtaa aikaisintaan vuonna 2030. Täytäntöönpanoa vaikeuttaa tarve kehittää määräyksiä. Singaporessa ja Yhdysvalloissa automatisoitu kuljetus on jo täydessä vauhdissa valtateiden varrella, ja hiljattain on ilmestynyt lupa testata miehittämätöntä taksia Venäjällä.

”Automaatio paranee lähes ainaturvallisuus, mutta ihmiset suhtautuvat tällaisten teknologioiden käyttöön pelolla”, Oleg Svidchenko on varma. — Jos korvaat kaiken kuljetuksen miehittämättömillä Tesloilla, onnettomuuksien määrä teillä putoaa useita kertoja. Mutta jokainen onnettomuus herättää monia kysymyksiä. Emme voi sanoa varmasti, kuten ihmisen tapauksessa, mikä aiheutti onnettomuuden. Ja ihmiset pelkäävät tätä tuntematonta."

"Toinen alue, joka odottaa läpimurtoa vahvistusoppimisen ansiosta, on liikenne"

Kuinka digitaalisista kaksosista on hyötyä ihmiskunnalle

Vahvistusoppimisalgoritmit ovat tehneet sen mahdolliseksiLuo digitaalisia kaksosia - virtuaalisia prototyyppejä esineistä, prosesseista ja jopa ihmisistä, jotka sisältävät samat ominaisuudet ja ominaisuudet kuin alkuperäiset. Teollisuusyritykset käyttävät tätä tekniikkaa esimerkiksi tarkistaakseen, onko kaikki prosessit oikein säädetty ennen uuden kuljettimen käynnistämistä. Voit tietysti laittaa pistokkeen heti pistorasiaan, mutta jos vika ilmenee, sen korjaaminen vie aikaa ja resursseja. Siksi kuljetin käynnistetään ensin tietokoneella. 

Ihmisten digitaalisten kaksosten kanssa kaikki on paljon paremminvaikeampaa, koska elävä organismi on monimutkaisempi järjestelmä. Ja silti tutkijat jatkavat tekniikan hallintaa luoden virtuaalisia kopioita sekä yksittäisistä elimistä että koko organismista. Esimerkiksi Bostonin sairaalassa käytetään digitaalista sydämen kaksoset leikkausten suunnitteluun. Tulevaisuudessa tämä mahdollistaa hoitomenetelmien testaamisen virtuaalipotilaalla, sairauksien ennustamista ja saattaa hyvinkin väittää olevansa vallankumous lääketieteessä.

"Tekoälyn kehitys, mukaan lukien RL, voi johtaase, että ihmiset alkavat ymmärtää itseään paremmin”, Aleksey Shpilman ehdottaa. ”Ihminen on suljettu järjestelmä, koska käytämme omia aivojamme itsetuntemukseen. Mutta riittääkö tämä työkalu meille? Psykologiassakin tarvitaan kahta ihmistä reflektointiin, ja olemme suljettuja itsessämme. Globaalisti universumin kontekstissa ihmiskunta on edelleen yksin, mikä tarkoittaa, että meillä ei ole ketään, jolle puhua oppiaksemme jotain uutta itsestämme ja katsoaksemme ulkopuolelta. Ehkä vahvistusoppimisen ansiosta luomme jonkinlaisen kokonaisuuden itsemme ulkopuolelle. Aivomme ja tietoisuutemme eivät rajoita sitä, vaan se pystyy antamaan ihmiselle uusia vastauksia ja merkityksiä."

Miksi RL:n laaja täytäntöönpano on edelleen rajallista

Huolimatta tutkijoiden edistymisestä, RL:n käytännön soveltaminen on edelleen rajallista. Järjestelmän oppiminen kestää kauan ja tekee paljon virheitä, joten algoritmin toteuttaminen kaikkialla on vaikeaa ja kannattamatonta.

"Agentti tarvitsee enemmän toistoja, joten prosessioppiminen kestää melko kauan, - selittää Alexander Grishin - Lisäksi ei riitä, että tekoäly suorittaa parhaan toiminnan. Hänen on tutkittava ympäristöä, sillä tällä hetkellä epämiellyttävien liikkeiden takana voi olla suuri palkinto. Vahvistusoppimisen koko logiikka perustuu siihen, että tekoäly oppii uhraamaan lyhyen aikavälin hyödyt pitkän aikavälin menestyksen eteen. Tätä varten sinun on ajateltava etukäteen ja laskettava mahdolliset skenaariot tapahtumien kehittymiselle. Esimerkiksi kun agentti luovuttaa ritarin vangitakseen kuningattaren, tiedemiehet ovat hyvin onnellisia."

Tiedemiesten tehtävänä on varmistaa, että tekoäly kasvaaoppimistahti ja parantunut analysointikyky. Mutta yksi arkipäiväinen ongelma estää nopean edistymisen: T&K-laboratorioissa ja IT-yrityksissä on pulaa henkilöstöstä. Yliopistot perustavat laboratorioita ja tutkimuskeskuksia, teknologiajätit avaavat erikoiskursseja.

"Koneoppimisen tutkimusta nyterittäin kysyntää. Toimiala kehittyy nopeasti ja henkilöstöpula kasvaa päivä päivältä”, Aleksei Shpilman sanoo. ”Spesialistilla on loistava mahdollisuus päästä mukaan prosesseihin, jotka muuttavat maailmaa tuntemattomaan. Paljon mielenkiintoisia töitä. Nyt olemme polun alussa, mutta olemme jo saavuttaneet hyviä tuloksia. Voitteko kuvitella, mitä näkymiä ihmiskunnalle avautuu RL:n käytön ansiosta?

Lue lisää:

Avaruusluotain lensi 200 kilometrin päässä Merkuriuksesta. Katso mitä hän näki

Tutkijat paljastavat, kuinka vitamiinit vaikuttavat syövän ilmaantumiseen

Kiinalainen ajatustenlukukypärä hälyttää, kun henkilö näkee pornosisältöä

Geek Tech verkossa

Kaikki teknologiasta ja gadgeteista

Oma opettajasi: kuinka algoritmit oppivat ilman ihmisen apua ja tekevät droneista parempia

Kuinka tekoäly oppii ilman mentoria

Millä alueilla tekoäly tulee ihmisten avuksi

Kuinka digitaalisista kaksosista on hyötyä ihmiskunnalle

Miksi RL:n laaja täytäntöönpano on edelleen rajallista