
Pekin Üniversitesi'nden bir bilim adamı yakın zamanda bu konuyu ayrıntılarıyla anlatan bilimsel bir makalenin ön baskısını yayınladı.
Öz nedir
Türdeki çoğu araştırma“takip-kaçınma” Yapay zeka ve oyun teorisi, makinelere uzayı keşfetmeyi öğretmekle ilgilidir. Çoğu yapay zeka eğitimi, makineyi bir hedefe ulaştığında ödüllendiren bir sistem içerdiğinden, geliştiriciler genellikle oyunlaştırmayı öğrenme için bir teşvik olarak kullanır.
Başka bir deyişle, bir odaya bir robot yerleştirip "şunu yap" diyemezsiniz. Ona hedefler ve onlara ulaşması için bir sebep vermelisiniz. Bu yüzdenaraştırmacılar, doğası gereği ödüllendirmeyi amaçlayan yapay zeka geliştiriyorlar.
Geleneksel zeka eğitimi ortamının zorluklarıBir yapay zeka aracısı, hedeflerini tamamlayana veya bir ödül bulana kadar alanı keşfetmek için dijital modelleri manipüle etmekle görevlendirilir. Pac Man'i anımsatıyor: Yapay zeka, tüm ödül topaklarını yiyene kadar çevrede hareket etmelidir.
Sorunun geçmişi
DeepMind'ın AI sistemlerinden beriSatranç ve Go'da ustalaşan SCII, rekabetçi yapay zeka için birincil eğitim ortamı haline geldi. Oyuncuların, yapay zekanın veya oyuncu ve yapay zeka kombinasyonlarının doğal olarak birbirine karşı çıktığı bir oyundur.
Ama daha da önemlisi, DeepMind ve diğerleriaraştırma kuruluşları, geliştiricilerin işlerine odaklanmalarını sağlayan çeşitli mini oyunlarla oyunun kaynak kodunu bir yapay zeka oyun alanına dönüştürmek için şimdiden çok uğraştı.
Adı geçen bilim adamı Araştırmacı Xun HuangPekin Üniversitesi'nden 'takip-kaçınma paradigması'nı incelemek üzere yola çıktı; AI modellerini eğitmek için. Ancak SCII modelinin bazı sınırlayıcı sınırlamaları olduğunu keşfettim: Oyunun yerleşik versiyonunda 'takipten kaçma'; Takipçilerin kontrolü yalnızca yapay zekaya emanet edilebilir.

Temel şema üç takip içerirkarakter (oyundaki askerler tarafından temsil edilir) ve 25 kaçak karakter (oyundaki uzaylılar tarafından temsil edilir). Ayrıca 'savaş sisi'ni kullanan bir mod da var; haritayı karartarak takipçinin kaçanı tespit etmesini ve yok etmesini zorlaştırıyor, ancak araştırmalara göre bu bir 1V1 modu.
Komik ama temel davranışlar 25Dodgers'ın stratejisi, göründükleri yerde sabit kalmak ve ardından takipçilerine anında saldırmaktır. Takipçiler, kaçanlardan çok daha güçlü olduğundan, bu, her kaçanın tespit edilir edilmez yok edilmesiyle sonuçlanır.
Perspektifler
Huang'ın makalesi paradigmayı ayrıntılı olarak anlatıyorYapay zekanın takipçilerden kaçmasını öğretmeye odaklanan SCII ortamında yapay zeka eğitimi. Onların versiyonunda yapay zeka, yakalanma ve ölümden kaçınmak için "savaş sisi" içinde saklanmaya çalışıyor.
Bu büyüleyici bir çalışmadır.gerçek dünya üzerinde büyük etkileri olabilecek video oyunları. Dünyanın en gelişmiş askeri örgütleri insanları eğitmek için video oyunlarını kullanıyor. Ve yapay zeka geliştiricileri, yapay zeka beyinlerini gerçek bir robotun içindeki hayata hazırlamak için bu öğrenme ortamlarını kullanıyor.
Tamamen teorik olarak Huang'ın çalışması öyle görünüyor kiheyecan verici. Ancak sadece sahada koşup zıplama değil, aynı zamanda özel kuvvetler ekibinin takibinden kasıtlı olarak kaçma yeteneğine sahip bir Boston Dynamics robotu hayal edin.
Kaynak: arxiv, deepmind, thenextweb
İllüstrasyonlar: goodfon
</ p>