Алгоритм MIT вчить системи штучного інтелекту скептицизму

Команда з MIT об'єднала алгоритм навчання даними з глибокою нейронною мережею, які використовують, наприклад,

для навчання алгоритму гри у відеоігри. 

Щоб зробити системи штучного інтелекту стійкою до даних, що суперечать, дослідники спробували впровадити захист для контрольованого навчання.

Традиційно нейронна мережа навчається пов'язуватипевні мітки або дії з заданими вхідними даними. Наприклад, нейронна мережа, яка отримує тисячі зображень, позначених як кішки, поряд із зображеннями, позначеними як вдома і хот-доги, повинна правильно позначити нове зображення як кішку.

В надійних системах штучного інтелекту тіж методи контрольованого навчання можуть бути протестовані з частково зміненими версіями зображення. Якщо мережу потрапляє на одну і ту ж мітку - кішка - є високий шанс, що ізобращеніе і змінами або без є кішкою.

Щоб використовувати нейронні мережі в критичнихдля безпеки сценаріях, ми повинні були з'ясувати, як приймати рішення в реальному часі, ґрунтуючись на найгірших припущеннях, пояснюють автори роботи. 

Тому команда прагнула спиратися на ще однуформу машинного навчання, яка не вимагає зв'язування помічених вхідних даних з вихідними, а скоріше спрямована на посилення певних дій у відповідь на вхідні дані. Цей підхід зазвичай використовується для навчання комп'ютерів грі в шахи і Го.

Автори вважають, що новий алгоритм CARRL може допомогти роботам безпечно справлятися з непередбаченими взаємодіями в реальному світі.

Читати далі

Фізики створили аналог чорної діри і підтвердили теорію Хокінга. До чого це призведе?

Алгоритм виявив новий таємничий шар всередині Землі

Через Сонця атмосфера Землі втратить весь вільний кисень