Двоногий робот вчиться ходити, використовуючи навчання з підкріпленням

Робота полягала у створенні двоногого робота. Його пара кінцівок з'єднана разом невеликою

утримуючою рамою.Наразі робот, якого автори назвали «Кессі», виконує свої завдання прив'язаним до рами, якою керує один із дослідників. Порівняно з іншими роботами, наприклад із розробками Boston Dynamics, «Кессі» здається примітивним. Однак він є передовою технологією нового типу, в якій робот сам вчиться ходити без прямого програмування або імітації.

Як вчаться ходити люди?Використовуючи навчання з підкріпленням! Немовлята набувають цю навичку, пробуючи нові руху. Вони не розуміють весь процес відразу, але запам'ятовують кроки, які призводять до ходьби. А потім спираються на те, що дізналися, додаючи додаткову інформацію, яка в кінцевому підсумку призводить до правильної ходьбі. При цьому діти не зупиняються на досягнутому; вони продовжують вчитися, і їх хода стають краще. Згодом діти освоюють нові прийоми - як біг і стрибки.

Щоб допомогти роботу навчитися ходити таким жечином, дослідники почали з його моделювання в віртуальному світі. Там робот він навчений за допомогою інформації, а ІІ міг запам'ятовувати і використовувати їй. Моделювання дозволило роботу навчитися ходити, не пошкодивши обладнання.

Як тільки робот навчився ходітьв симуляції,дослідники передали його знання «Кессі», яка використовувала їх для ходьби, як у немовлят. І, як малюк, «Кессі» вона вдосконалювала свої навички. Вона навчилася не падати при невеликому ковзанні або відновлюватися, коли її штовхають збоку. Крім того, їй вдалося навчити компенсувати збиток, коли обидва її двигуна пошкоджені. Дослідники планують продовжити свою роботу з навчанням з підкріпленням в роботах, щоб побачити, наскільки далеко вони можуть зайти.

Читати далі

Створено першу точна карта світу. Що не так з усіма іншими?

Уран отримав статус самої дивної планети в Сонячній системі. Чому?

У НАСА розповіли, як вони доставлять зразки Марса на Землю