Tolle Neuigkeiten: Wissenschaftler lehren KI-Techniken, um der Verfolgung zu entgehen

Ein Wissenschaftler der Peking-Universität hat kürzlich einen Vorabdruck eines wissenschaftlichen Artikels veröffentlicht, in dem dies detailliert beschrieben wird

ein auf Videospielen basierendes System, das KI-Hosts darin trainieren soll, einer Verfolgung auszuweichen.

Was ist die Essenz

Die meisten Studien in diesem Genre“Verfolgung-Vermeidung” In der KI- und Spieltheorie geht es darum, Maschinen beizubringen, den Weltraum zu erkunden. Da es sich bei den meisten KI-Schulungen um ein System handelt, das die Maschine für das Erreichen eines Ziels belohnt, nutzen Entwickler häufig Gamification als Lernanreiz.

Mit anderen Worten: Sie können nicht einfach einen Roboter in einen Raum stellen und sagen: „Mach das.“ Sie müssen ihm Ziele und einen Grund nennen, diese zu erreichen. DeshalbForscher entwickeln KI, die von Natur aus belohnen will.

Die Herausforderungen der herkömmlichen Trainingsumgebung für GeheimdiensteEin KI-Agent hat die Aufgabe, digitale Modelle zu manipulieren, um den Weltraum zu erkunden, bis er seine Ziele erreicht oder eine Belohnung findet. Es erinnert an Pac Man: Die KI muss sich in der Umgebung bewegen, bis sie alle Belohnungspellets aufgefressen hat.

Geschichte des Problems

Seit den KI-Systemen von DeepMindSchach beherrscht, wurde SCII zur primären Trainingsumgebung für wettbewerbsfähige KI. Es ist ein Spiel, in dem Spieler, KI oder Kombinationen von Spielern und KI sich natürlich gegenüberstehen.

Aber noch wichtiger, DeepMind und andereForschungsorganisationen haben bereits die harte Arbeit geleistet, den Quellcode des Spiels in einen KI-Spielplatz mit mehreren Minispielen zu verwandeln, die es Entwicklern ermöglichen, sich auf ihre Arbeit zu konzentrieren.

Forscher Xun Huang, der oben genannte Wissenschaftlervon der Universität Peking, machte sich daran, das „Verfolgungs-Umgehungs-Paradigma“ zu studieren. zum Trainieren von KI-Modellen. Aber ich habe herausgefunden, dass das SCII-Modell einige einschränkende Einschränkungen hat: In der integrierten Version des Spiels „Verfolgung-Umgehung“; Die Kontrolle über Verfolger kann nur der KI anvertraut werden.

Das Grundschema umfasst drei VerfolgungenCharakter (dargestellt durch die Soldaten aus dem Spiel) und 25 Ausweichcharaktere (dargestellt durch die Außerirdischen aus dem Spiel). Es gibt auch einen Modus, der „Fog of War“ nutzt. um die Karte abzudunkeln, was es für den Verfolger schwierig macht, den Ausreißer zu entdecken und zu zerstören, aber laut Recherche handelt es sich hierbei um einen 1V1-Modus.

Lustiges, aber grundlegendes Verhalten 25Die Strategie der Dodgers besteht darin, dort zu bleiben, wo sie auftauchen, und ihre Verfolger dann sofort anzugreifen. Da die Verfolger viel stärker sind als die Flüchtigen, führt dies zur erwarteten Zerstörung jedes Flüchtenden unmittelbar nach seiner Entdeckung.

Perspektiven

Huangs Artikel beschreibt das Paradigma im DetailKI-Training in der SCII-Umgebung, das sich darauf konzentriert, der KI beizubringen, Verfolgern auszuweichen. In ihrer Version versucht die KI, sich im „Nebel des Krieges“ zu verstecken, um Gefangennahme und Tod zu vermeiden.

Dies ist eine faszinierende Studie mitVideospiele, die enorme Auswirkungen auf die reale Welt haben könnten. Die fortschrittlichsten Militärorganisationen der Welt nutzen Videospiele, um Menschen auszubilden. Und KI-Entwickler nutzen diese Lernumgebungen, um KI-Gehirne auf das Leben in einem echten Roboter vorzubereiten.

Rein theoretisch scheint Huangs Arbeit zu seinspannend. Aber stellen Sie sich einen Boston Dynamics-Roboter vor, der nicht nur über die Fähigkeit verfügt, auf dem Gelände herumzurennen und zu springen, sondern auch gezielt der Verfolgung durch eine Spezialeinheit auszuweichen.

Quelle: arxiv, deepmind, thenextweb

Illustrationen: goodfon

</ p>