Wspaniała wiadomość: naukowcy uczą technik AI, aby uniknąć pościgu

Naukowiec z Uniwersytetu w Pekinie opublikował niedawno wstępny wydruk artykułu naukowego zawierającego szczegółowe informacje

system oparty na grach wideo, zaprojektowany do szkolenia hostów AI w zakresie unikania pościgu.

Jaka jest istota

Większość opracowań z gatunku„unikanie pościgu” zajmujący się sztuczną inteligencją i teorią gier zajmują się uczeniem maszyn eksploracji kosmosu. Ponieważ większość szkoleń AI obejmuje system nagradzający maszynę za osiągnięcie celu, programiści często wykorzystują grywalizację jako zachętę do nauki.

Innymi słowy, nie możesz po prostu umieścić robota w pokoju i powiedzieć: „zrób to”. Musisz dać mu cele i powód, aby je osiągnąć. Dlategonaukowcy opracowują sztuczną inteligencję, która ze swej natury ma na celu nagradzanie.

Tradycyjne środowisko szkolenia wywiadowczego stanowi wyzwanieAgent sztucznej inteligencji ma za zadanie manipulować modelami cyfrowymi w celu eksploracji kosmosu, dopóki nie osiągnie swoich celów lub nie znajdzie nagrody. Przypomina to Pac Mana: sztuczna inteligencja musi poruszać się po otoczeniu, dopóki nie zje wszystkich granulek z nagrodami.

Historia problemu

Od czasów systemów AI DeepMindopanował szachy i go, SCII stał się podstawowym środowiskiem treningowym dla konkurencyjnej sztucznej inteligencji. Jest to gra, w której gracze, sztuczna inteligencja lub kombinacje graczy i sztucznej inteligencji naturalnie przeciwstawiają się sobie.

Ale co ważniejsze, DeepMind i inniисследовательские организации уже проделали тяжелую работу по превращению исходного кода игры в игровую площадку для ИИ с несколькими мини-играми, которые позволяют разработчикам сосредоточиться на своей работе.

Badacz Xun Huang, wspomniany naukowiecz Uniwersytetu w Pekinie, postanowił zbadać „paradygmat pościgu-uchylania się”; do szkolenia modeli AI. Odkryłem jednak, że model SCII ma pewne ograniczenia: we wbudowanej wersji gry „unikanie pościgu”; Kontrolę nad prześladowcami można powierzyć wyłącznie sztucznej inteligencji.

Podstawowy schemat obejmuje trzy realizacjepostać (reprezentowana przez żołnierzy z gry) i 25 postaci uciekinierów (reprezentowanych przez kosmitów z gry). Istnieje również tryb wykorzystujący „mgłę wojny”; przyciemnić mapę, utrudniając ścigającemu wykrycie i zniszczenie uciekającego, ale według badań jest to tryb 1 na 1.

Zabawne, ale podstawowe zachowanie 25Strategia Dodgersów polega na pozostawaniu w bezruchu, gdziekolwiek się pojawią, a następnie natychmiastowym atakowaniu prześladowców. Ponieważ prześladowcy są znacznie silniejsi od uciekinierów, skutkuje to oczekiwanym zniszczeniem każdego uciekiniera natychmiast po wykryciu.

Perspektywy

Artykuł Huanga szczegółowo opisuje ten paradygmatSzkolenie AI w środowisku SCII, które skupia się na uczeniu AI unikania prześladowców. W ich wersji sztuczna inteligencja próbuje ukryć się we „mgle wojny”, aby uniknąć schwytania i śmierci.

To fascynujące badaniegry wideo, które mogą mieć ogromne implikacje dla prawdziwego świata. Najbardziej zaawansowane organizacje wojskowe na świecie wykorzystują gry wideo do szkolenia ludzi. Twórcy sztucznej inteligencji korzystają z tych środowisk edukacyjnych, aby przygotować mózgi sztucznej inteligencji do życia w prawdziwym robocie.

Wydaje się, że praca Huanga jest czysto teoretycznieekscytujący. Ale wyobraźcie sobie robota Boston Dynamics, który potrafi nie tylko biegać i skakać po terenie, ale także celowo unikać pościgu oddziału sił specjalnych.

Źródło: arxiv, deepmind, thenextweb

Ilustracje: goodfon

</ p>