
Vědec z Pekingské univerzity nedávno zveřejnil předtisk vědeckého článku s podrobnostmi
Co je podstatou
Nejvíce výzkumů v žánru“vyhýbání se pronásledování” v AI a teorii her se zabývají výukou strojů k prozkoumávání vesmíru. Protože většina školení AI zahrnuje systém, který odměňuje stroj za dosažení cíle, vývojáři často používají gamifikaci jako pobídku k učení.
Jinými slovy, nemůžete jen tak strčit robota do místnosti a říct “udělej tohle”. Musíte mu dát cíle a důvod, proč jich dosáhnout. Protovýzkumníci vyvíjejí AI, která se ze své podstaty snaží odměňovat.
Tradiční prostředí pro výuku zpravodajských služeb je výzvouAgent AI má za úkol manipulovat s digitálními modely, aby prozkoumal vesmír, dokud nesplní své cíle nebo nenajde odměnu. Připomíná to Pac Mana: AI se musí pohybovat po prostředí, dokud nesežere všechny pelety odměn.
Historie problému
Už od dob systémů umělé inteligence DeepMindzvládl šachy a go, SCII se stal primárním tréninkovým prostředím pro konkurenceschopnou AI. Je to hra, ve které se hráči, AI nebo kombinace hráčů a AI přirozeně staví proti sobě.
Ale co je důležitější, DeepMind a dalšívýzkumné organizace již odvedly tvrdou práci a přeměnily zdrojový kód hry na hřiště AI s několika minihrami, které umožňují vývojářům soustředit se na svou práci.
Výzkumník Xun Huang, výše zmíněný vědecz Pekingské univerzity se vydal studovat “paradigma pronásledování-vyhýbání se” pro trénování modelů AI. Ale zjistil jsem, že model SCII má určitá omezující omezení: ve vestavěné verzi hry “pursuit-evasion” Ovládání pronásledovatelů může být svěřeno pouze AI.

Základní schéma zahrnuje tři pronásledovánípostava (zastoupená vojáky ze hry) a 25 postavami evader (zastoupenými mimozemšťany ze hry). K dispozici je také režim, který využívá “fog of war” ztmavit mapu, což pronásledovateli znesnadní odhalení a zničení evadera, ale podle výzkumu se jedná o režim 1V1.
Vtipné, ale základní chování 25Strategií Dodgers je zůstat na místě, kdekoli se objeví, a poté na místě zaútočit na své pronásledovatele. Vzhledem k tomu, že pronásledovatelé jsou mnohem silnější než ti, kdo se vyhýbají útěku, vede to k očekávanému zničení každého z nich okamžitě po odhalení.
Vyhlídky
Huangův článek podrobně popisuje paradigmaŠkolení AI v prostředí SCII, které se zaměřuje na výuku umělé inteligence vyhýbat se pronásledovatelům. V jejich verzi se AI snaží schovat v „válečné mlze“, aby se vyhnula zajetí a smrti.
Toto je fascinující použití studievideohry, které by mohly mít obrovské důsledky pro skutečný svět. Nejpokročilejší vojenské organizace na světě používají videohry k výcviku lidí. A vývojáři AI používají tato výuková prostředí k přípravě mozků AI na život uvnitř skutečného robota.
Čistě teoreticky se zdá, že Huangova prácevzrušující. Ale představte si robota Boston Dynamics, který má schopnost nejen běhat a skákat po místě, ale také se cíleně vyhýbat pronásledování jednotky speciálních sil.
Zdroj: arxiv, deepmind, thenextweb
Ilustrace: goodfon
</ p>