Buenas noticias: los científicos enseñan técnicas de inteligencia artificial para evadir la persecución

Un científico de la Universidad de Pekín publicó recientemente una preimpresión de un artículo científico que detalla

un sistema basado en videojuegos diseñado para entrenar a los anfitriones de IA para evadir la persecución.

Cual es la esencia

La mayoría de los estudios del género.“evitación de persecución” en IA y teoría de juegos se ocupan de enseñar a las máquinas a explorar el espacio. Dado que la mayor parte del entrenamiento en IA implica un sistema que recompensa a la máquina por lograr un objetivo, los desarrolladores suelen utilizar la gamificación como incentivo para el aprendizaje.

En otras palabras, no se puede simplemente colocar un robot en una habitación y decirle "haz esto". Debes darle metas y una razón para alcanzarlas. Es por esoLos investigadores están desarrollando IA que por su naturaleza busca recompensar.

Los desafíos del entorno tradicional de entrenamiento de inteligenciaUn agente de IA tiene la tarea de manipular modelos digitales para explorar el espacio hasta completar sus objetivos o encontrar una recompensa. Recuerda a Pac Man: la IA debe moverse por el entorno hasta comerse todas las bolitas de recompensa.

Historia del problema

Desde los sistemas de inteligencia artificial de DeepMindDominado el ajedrez y listo, SCII se convirtió en el entorno de entrenamiento principal para la IA competitiva. Es un juego en el que los jugadores, la IA o combinaciones de jugadores e IA se oponen naturalmente entre sí.

Pero lo que es más importante, DeepMind y otrosLas organizaciones de investigación ya han hecho el arduo trabajo de convertir el código fuente del juego en un campo de juegos de inteligencia artificial con varios minijuegos que permiten a los desarrolladores concentrarse en su trabajo.

El investigador Xun Huang, el científico antes mencionado.de la Universidad de Pekín, se propuso estudiar el “paradigma de persecución-evasión” para entrenar modelos de IA. Pero descubrí que el modelo SCII tiene algunas limitaciones: en la versión incorporada del juego “pursuit-evasion” El control de los perseguidores sólo puede confiarse a la IA.

El esquema básico incluye tres programaspersonaje (representado por los soldados del juego) y 25 personajes evasores (representados por los alienígenas del juego). También hay un modo que utiliza “niebla de guerra” para oscurecer el mapa, lo que dificulta que el perseguidor detecte y destruya al evasor, pero según la investigación, este es un modo 1V1.

Comportamiento divertido pero básico 25La estrategia de los Dodgers es permanecer estacionarios dondequiera que aparezcan y luego atacar a sus perseguidores en el acto. Dado que los perseguidores son mucho más fuertes que los evasores, esto da como resultado la destrucción esperada de cada evasor inmediatamente después de ser detectado.

Perspectivas

El artículo de Huang describe el paradigma en detalle.Entrenamiento de IA en el entorno SCII, que se centra en enseñar a la IA a evadir a sus perseguidores. En su versión, la IA intenta esconderse en la “niebla de guerra” para evitar la captura y la muerte.

Este es un estudio fascinante que utilizavideojuegos que podrían tener enormes implicaciones para el mundo real. Las organizaciones militares más avanzadas del mundo utilizan videojuegos para entrenar personas. Y los desarrolladores de IA utilizan estos entornos de aprendizaje para preparar los cerebros de IA para la vida dentro de un robot real.

En términos puramente teóricos, el trabajo de Huang pareceemocionante. Pero imagínese un robot de Boston Dynamics, dotado de la capacidad no sólo de correr y saltar por el lugar, sino de evadir deliberadamente la persecución de un escuadrón de fuerzas especiales.

Fuente: arxiv, deepmind, thenextweb

Ilustraciones: goodfon

</ p>