Нова автоматична модель розпізнавання Facebook працює з 51 мовами

Дослідники Facebook представили найбільшу модель автоматичного розпізнавання мови (ASR). вона навчилася

розуміти 51 мова після того, як її навчили на 16тис. годин голосових записів. У статті, опублікованій на сайті Arxiv.org, співавтори роботи стверджують, що система, яка містить близько мільярда параметрів, підвищує ефективність розпізнавання мови до 28,8%.

Перш ніж завантажити матеріали, вчені розділили51 мова на окремі групи, а потім вибрали 10 тис. Одиниць словника як набір інформації по кожній мовній групі. Після цього вони вручну об'єднали деякі дрібні мовні групи, поки їх не залишилося всього 6. Це в кілька разів прискорило процес навчання моделі.

«Наскільки нам відомо, ця перша робота,яка вивчає багатомовні системи в масовому масштабі. Ми отримали єдину архітектуру розпізнавання мови для 51 мови, яка не вимагає великої кількості ресурсів », - відзначили в Facebook.

Дослідники повідомляють, що в ході декількохекспериментів найбільш ефективна версія їх моделі розпізнавала слова з ефективність в 28,75%. Цей показник у кілька разів вище, ніж у аналогів, і буде поліпшуватися в міру навчання.

У статті вчені також відзначили, що скоро вони опублікують другу версію системи. Вона стала простіше і досягає потрібних результатів всього за 10 хвилин. Її навчили на 53 тис. Годин «сирих» матеріалів.

Читайте також

- З'ясувалося, що змусило цивілізацію майя покинути свої міста

- Вчені розкрили план герпесу по зараженню людини: він схожий на гру cо ставками

- На 3 день хвороби більшість хворих COVID-19 втрачають нюх і часто страждають нежиттю