Skvělá zpráva: Vědci učí techniky AI vyhýbat se pronásledování

Vědec z Pekingské univerzity nedávno zveřejnil předtisk vědeckého článku s podrobnostmi

systém založený na videohrách navržený k výcviku hostitelů AI, aby se vyhnuli pronásledování.

Co je podstatou

Nejvíce výzkumů v žánru“vyhýbání se pronásledování” v AI a teorii her se zabývají výukou strojů k prozkoumávání vesmíru. Protože většina školení AI zahrnuje systém, který odměňuje stroj za dosažení cíle, vývojáři často používají gamifikaci jako pobídku k učení.

Jinými slovy, nemůžete jen tak strčit robota do místnosti a říct “udělej tohle”. Musíte mu dát cíle a důvod, proč jich dosáhnout. Protovýzkumníci vyvíjejí AI, která se ze své podstaty snaží odměňovat.

Tradiční prostředí pro výuku zpravodajských služeb je výzvouAgent AI má za úkol manipulovat s digitálními modely, aby prozkoumal vesmír, dokud nesplní své cíle nebo nenajde odměnu. Připomíná to Pac Mana: AI se musí pohybovat po prostředí, dokud nesežere všechny pelety odměn.

Historie problému

Už od dob systémů umělé inteligence DeepMindzvládl šachy a go, SCII se stal primárním tréninkovým prostředím pro konkurenceschopnou AI. Je to hra, ve které se hráči, AI nebo kombinace hráčů a AI přirozeně staví proti sobě.

Ale co je důležitější, DeepMind a dalšívýzkumné organizace již odvedly tvrdou práci a přeměnily zdrojový kód hry na hřiště AI s několika minihrami, které umožňují vývojářům soustředit se na svou práci.

Výzkumník Xun Huang, výše zmíněný vědecz Pekingské univerzity se vydal studovat “paradigma pronásledování-vyhýbání se” pro trénování modelů AI. Ale zjistil jsem, že model SCII má určitá omezující omezení: ve vestavěné verzi hry “pursuit-evasion” Ovládání pronásledovatelů může být svěřeno pouze AI.

Základní schéma zahrnuje tři pronásledovánípostava (zastoupená vojáky ze hry) a 25 postavami evader (zastoupenými mimozemšťany ze hry). K dispozici je také režim, který využívá “fog of war” ztmavit mapu, což pronásledovateli znesnadní odhalení a zničení evadera, ale podle výzkumu se jedná o režim 1V1.

Vtipné, ale základní chování 25Strategií Dodgers je zůstat na místě, kdekoli se objeví, a poté na místě zaútočit na své pronásledovatele. Vzhledem k tomu, že pronásledovatelé jsou mnohem silnější než ti, kdo se vyhýbají útěku, vede to k očekávanému zničení každého z nich okamžitě po odhalení.

Vyhlídky

Huangův článek podrobně popisuje paradigmaŠkolení AI v prostředí SCII, které se zaměřuje na výuku umělé inteligence vyhýbat se pronásledovatelům. V jejich verzi se AI snaží schovat v „válečné mlze“, aby se vyhnula zajetí a smrti.

Toto je fascinující použití studievideohry, které by mohly mít obrovské důsledky pro skutečný svět. Nejpokročilejší vojenské organizace na světě používají videohry k výcviku lidí. A vývojáři AI používají tato výuková prostředí k přípravě mozků AI na život uvnitř skutečného robota.

Čistě teoreticky se zdá, že Huangova prácevzrušující. Ale představte si robota Boston Dynamics, který má schopnost nejen běhat a skákat po místě, ale také se cíleně vyhýbat pronásledování jednotky speciálních sil.

Zdroj: arxiv, deepmind, thenextweb

Ilustrace: goodfon

</ p>