Ваш сопствени учитељ: како алгоритми уче без људске помоћи и чине дронове бољим

Беспилотна возила, дигитални близанци и аутоматска контрола телекомуникација нису

предвиђања писаца научне фантастике и већБлиска будућност. Приближавају га научници који се баве примењеном вештачком интелигенцијом и истраживањем у области учења са појачањем. Хи-Тецх је разговарао о будућности технологије са Олегом Свидченком, Александром Гришином и Алексејем Шпилманом, добитницима годишње награде Сегаловић.

Како АИ учи без ментора

Учење са појачањем,РЛ) претпоставља да сама АИ ступа у интеракцију са одређеним окружењем - на пример, таблом за игру Го или спољним светом ако се робот креће дуж ње. Уређај треба да идентификује уобичајене обрасце и да се фокусира на њих приликом обављања задатака. А када учите са "учитељицом", потребна вам је особа која мора указати на тачну акцију на којој ће АИ тренирати.

„Суштина РЛ је да машина или, како ми кажемо,агент, учи у режиму сталне праксе“, напомиње Олег Свидченко, лауреат награде за науку Иандек. - АИ се ставља у одређене услове и "реци" - делуј. Ово је слично ситуацији када миш крене у потрагу за сиром у лавиринту. Након што је скренула у погрешном правцу, животиња се судара са зидом, враћа се, покушава поново, итд. У случају учења са појачањем, исправни кораци се награђују. Што је акција исправнија, више поена ће АИ добити. Ако се испостави да је избор нетачан, агент губи бодове. Током тренинга, машина памти која комбинација радњи је била исплативија и следећи пут ће је користити.

Независна потрага за решењем омогућава агентупре или касније надмашити човека. Ово је, на пример, показао ДеепМинд-ов МуЗеро алгоритам, који је научио да игра десетине старих Атари видео игара, шаха и игара на плочи Го-типа. Да би га створили, користили су претходни развој компаније: на пример, АлпхаГо, захваљујући којем је било могуће победити Го шампиона Ли Седола, и АлпхаЗеро, који се користи у шаху. Побољшани алгоритам издваја више информација из мање података – сада му је потребно пола корака обуке.

Алгоритми учења са поткрепљивањем могукорисно у разним индустријама. На пример, у медицини - за организовање персонализованог динамичког третмана, у индустрији забаве - за аутоматско тестирање компјутерских игрица, или у ваздухопловству - за аутономну контролу стратосферског балона.

У којим областима ће АИ прискочити у помоћ људима

Дигитализација малопродаје: потпуно аутоматизоване продавнице

Први који је имплементирао машинско учење у индустријамагде се отклања грешке у процесу прикупљања и дигитализације великих количина података. На пример, у малопродаји све информације пролазе кроз касе, што значи да АИ има са чиме да ради. Према речима Алексеја Шпилмана, коришћење алгоритама вештачке интелигенције ће омогућити стварање аутоматизованих продавница свуда, где ће се сви процеси одвијати без људске интервенције.

Овај формат је тестиран још 2016.Амазон компанија. Купац узима колица, преузима робу у њој и само одлази - новац за куповину се аутоматски наплаћује са картице. У Русији је сличан пројекат развила Азбука Вкуса.

„Купац узима колица, преузима робу у њима и само одлази - новац за куповину се аутоматски наплаћује са картице“

Управљање телекомуникацијама: препознавање грешака на мрежи&нбсп;

Захваљујући учењу са појачањемтехнолошки помаци могу настати у управљању разним мрежама – телекомуникацијама, топловодним мрежама, електроенергетиком. Многи процеси овде се прилично лако роботизују, јер нема много интеракције са људима.

Аутоматизација ће довести до стварања система којидоносиће боље информисане одлуке и оптимизовати потрошњу енергије. На пример, на основу РЛ алгоритама, развија се ХВАЦ контролер (акроним за Грејање, Вентилација, & Климатизација - Грејање, вентилација и климатизација) - ово је систем контроле собне температуре и вентилације. Коришћење ове технологије у предузећима ће помоћи у уштеди потрошње енергије и смањењу емисије угљеника.

Беспилотна возила: Технологија испитивања и законодавство

Још једна област која чека искорак захваљујућиучење поткрепљења – превоз. Већ данас се на улицама могу наћи беспилотна возила и роботи за доставу. Упркос технолошком напретку у индустрији, аналитичари МцКинсеиа предвиђају да дронови неће постати маинстреам најраније 2030. године. Имплементација је компликована потребом израде прописа. У Сингапуру и Сједињеним Државама аутоматизовани транспорт је већ у пуном јеку дуж аутопутева, а недавно се појавила и дозвола за тестирање беспилотног таксија у Русији.

„Аутоматизација се скоро увек побољшавабезбедности, али људи са страхом дочекују увођење таквих технологија“, сигуран је Олег Свидченко. —&нбсп;Ако сав транспорт замените беспилотним Теслама, број незгода на путевима ће пасти неколико пута. Али свака несрећа ће покренути многа питања. Не можемо са сигурношћу, као у случају особе, рећи шта је изазвало несрећу. И људи се плаше овог непознатог.”

„Још једна област која чека напредак захваљујући учењу са појачањем је транспорт“

Како ће дигитални близанци бити корисни човечанству

Алгоритми учења са појачањем су то омогућиликреирају дигиталне близанце - виртуелне прототипове објеката, процеса, па чак и људи који садрже иста својства и карактеристике као и оригинали. Индустријска предузећа користе ову технологију, на пример, да провере да ли су сви процеси правилно прилагођени пре покретања новог транспортера. Наравно, можете одмах убацити утикач у утичницу, али ако дође до квара, биће потребно време и ресурси да се то поправи. Дакле, транспортер се прво покреће на рачунару.&нбсп;

Све је много боље са људским дигиталним близанциматеже, јер је живи организам сложенији систем. Па ипак, научници настављају да савладавају технологију, стварајући виртуелне копије и појединачних органа и целог организма. На пример, болница у Бостону користи дигитални близанац срца за планирање операција. У будућности, ово ће омогућити тестирање метода лечења на виртуелном пацијенту, предвиђање болести и може се сматрати револуцијом у медицини.

„Развој АИ, укључујући РЛ, могао би довести дочињеница да ће људи почети боље да разумеју себе“, сугерише Алексеј Шпилман. „Човек је затворен систем, јер сопствени мозак користимо за самоспознају. Али да ли нам је овај алат довољан? И у психологији су за размишљање потребне две особе, а ми смо затворени у себи. Глобално, у контексту Универзума, човечанство је и даље само, што значи да немамо са ким да разговарамо како бисмо научили нешто ново о себи и погледали споља. Можда ћемо, захваљујући учењу са појачањем, створити неку врсту ентитета изван нас самих. То неће бити ограничено нашим мозгом и свешћу и моћи ће да пружи човеку нове одговоре и значења.”

Зашто је распрострањена примена РЛ-а још увек ограничена

Упркос напретку који су научници постигли, практична примена РЛ је и даље ограничена. Систему је потребно много времена да се учи и прави много грешака, тако да је имплементација алгоритма свуда тешка и неисплатива.

„Агенту је потребно више понављања, па самим тим и процесучење траје прилично дуго, - објашњава Александар Гришин - Штавише, није довољно да АИ изврши најбољу акцију. Он треба да истражи околину, јер се иза тренутно непривлачних потеза може сакрити велика награда. Цела логика учења са појачањем своди се на чињеницу да АИ учи да жртвује краткорочне користи за дугорочни успех. Да бисте то урадили, морате размишљати унапред и израчунати могуће сценарије за развој догађаја. На пример, када агент одустане од витеза да би ухватио краљицу, научници ће бити веома срећни.

Задатак научника је да обезбеде да АИ растетемпо учења и побољшана способност анализе. Али један свакодневни проблем спречава брз напредак: постоји недостатак особља у лабораторијама за истраживање и развој и ИТ компанијама. Универзитети стварају лабораторије и истраживачке центре, технолошки гиганти отварају специјализоване курсеве.

„Истраживање у машинском учењу садавеома тражен. Индустрија се убрзано развија, а недостатак кадрова сваким даном је све већи“, каже Алексеј Шпилман. „Специјалисти имају велику шансу да се укључе у процесе који ће променити свет до непрепознатљивости. Много занимљивих радова. Сада смо на самом почетку пута, али смо већ постигли добре резултате. Можете ли замислити какве ће се перспективе отворити за човечанство коришћењем РЛ?

Опширније:

Свемирска сонда је летела 200 км од Меркура. Погледај шта је видео

Научници откривају како витамини утичу на појаву рака

Кинески шлем за читање мисли звучи аларм када особа види порно садржај

Геек Тецх Онлине

Све о технологији и гаџетима

Ваш учитељ: како алгоритми уче без људске помоћи и чине дронове бољим

Како АИ учи без ментора

У којим областима ће АИ прискочити у помоћ људима

Како ће дигитални близанци бити корисни човечанству

Зашто је распрострањена примена РЛ-а још увек ограничена