Nagyszerű hír: A tudósok megtanítják az AI technikákat az üldözés elkerülésére

A Pekingi Egyetem tudósa a közelmúltban publikált egy részletező tudományos cikk előnyomatát

egy videojáték-alapú rendszer, amelyet arra terveztek, hogy a mesterséges intelligencia gazdáit arra tanítsák, hogy elkerüljék az üldözést.

Mi a lényeg

A legtöbb tanulmány a műfajban“üldözés-kerülés” A mesterséges intelligencia és a játékelmélet a gépek űrkutatási tanításával foglalkozik. Mivel a legtöbb mesterséges intelligencia képzés olyan rendszert foglal magában, amely jutalmazza a gépet a cél eléréséért, a fejlesztők gyakran használják a játékot a tanulás ösztönzéseként.

Más szóval, nem lehet egyszerűen egy robotot bedugni a szobába, és azt mondani, hogy “csináld ezt”. Célokat és okot kell adnod neki, hogy elérje azokat. azérta kutatók olyan mesterséges intelligenciát fejlesztenek, amely természeténél fogva jutalomra törekszik.

A hagyományos intelligencia képzési környezet kihívásokAz AI-ügynök feladata a digitális modellek manipulálása az űr felfedezése érdekében, amíg el nem éri céljait vagy jutalmat nem kap. A Pac Manre emlékeztet: az AI-nak addig kell mozognia a környezetben, amíg fel nem eszi az összes jutalompelletet.

A kérdés története

A DeepMind AI rendszerei ótaelsajátította a sakkot és a go -t, az SCII a versenyképes AI elsődleges képzési környezetévé vált. Ez egy olyan játék, amelyben a játékosok, az AI, vagy a játékosok és az AI kombinációi természetesen egymással szemben állnak.

De ami még fontosabb, a DeepMind és másokkutatószervezetek már elvégezték azt a kemény munkát, hogy a játék forráskódját AI -játszótérré alakítsák több minijátékkal, amelyek lehetővé teszik a fejlesztők számára, hogy a munkájukra összpontosítsanak.

Xun Huang kutató, a már említett tudósa Pekingi Egyetemen az “üldözés-elkerülési paradigma” AI modellek képzéséhez. De rájöttem, hogy a SCII-modellnek van néhány korlátozó korlátja: a játék beépített verziójában a “pursuit-easion” Az üldözők irányítását csak az AI-ra lehet bízni.

Az alaprendszer három követést tartalmazkarakter (amelyet a játék katonái képviselnek) és 25 elkerülő karakter (amelyeket a játék idegenei képviselnek). Van olyan mód is, amely a “fog of war” elsötétíteni a térképet, megnehezítve az üldöző számára az elkerülő észlelését és megsemmisítését, de a kutatások szerint ez egy 1V1 mód.

Vicces, de alapvető viselkedés 25A Dodgers stratégiája az, hogy helyben maradnak, bárhol megjelennek, majd a helyszínen megtámadják üldözőiket. Mivel az üldözők sokkal erősebbek, mint az elkerülők, ez azt eredményezi, hogy az észlelés után minden kitűző azonnal megsemmisül.

Kilátások

Huang cikke részletesen leírja a paradigmátMI-képzés SCII-környezetben, amelynek középpontjában az AI megtanítása az üldözők elkerülésére. Az ő verziójukban az AI megpróbál elrejtőzni a „háború ködében”, hogy elkerülje az elfogást és a halált.

Ez egy lenyűgöző tanulmányvideojátékok, amelyek hatalmas hatással lehetnek a való világra. A világ legfejlettebb katonai szervezetei videojátékokat használnak az emberek képzésére. A mesterséges intelligencia fejlesztői pedig ezeket a tanulási környezeteket arra használják, hogy felkészítsék a mesterséges intelligencia agyát a valódi roboton belüli életre.

Pusztán elméletileg úgy tűnik, Huang munkájaizgalmas. De képzeljünk csak el egy Boston Dynamics robotot, amely nem csak futni és ugrálni képes a helyszínen, hanem szándékosan kibújik a különleges alakulat üldözése elől.

Forrás: arxiv, deepmind, thenextweb

Illusztrációk: goodfon

</ p>