Британська робототехнічна компанія Engineered Arts продемонструвала нові можливості гуманоїдного робота
Розробники вказують в описі до відео, щодля розмови та перекладу у цій демонстрації Ameca використовувала мовну модель GPT-3. Крім того, роботу інтегрували модель машинного навчання DeepL для розпізнавання мови та генерації голосу.
Ameca розмовляє різними мовами. Відео: Engineered Arts
Раніше Engineered Arts демонстрував здатністьсвого робота реалістично передавати різні емоції: від здивування та невдоволення до огиди. Дослідники зазначають, що вони намагалися використовувати для навчання мовам дві моделі GPT-3 та GPT-4. При цьому пізніша модель призвела до уповільненого відгуку, через який реалістичність передачі виразів обличчя скоротилася.
В даний час команда працює наддемо-версією робота, яка використовуватиме систему клонування голосу від компанії Eleven labs. Ця модель використовує складнішу міміку завдяки додатковій «генерації фонем» синхронізації губ. Очікується, що модернізована версія робота буде представлена найближчим часом.
Читати далі:
Спеціальна дієта запускає самознищення ракових клітин мозку у мишей
Вчені розшифрували загадковий рукопис Птолемея. Він був прихований під іншим текстом
Новий знімок «Хаббла» спантеличив вчених