ІІ навчається ефективніше, якщо замінити числові мітки на людський голос

Дослідники виявили, що якщо порівнювати нейронні мережі з різними навчальними мітками, то ефективніше

будуть записані людським голосом, а не за допомогою простих двійкових вхідних даних. 

Мова двійкових чисел компактний і точний дляпередачі інформації. На відміну від цього, розмовний людську мову більш тональний і аналоговий. Оскільки числа є ефективним способом оцифровки даних, програмісти рідко використовують входине дані іншого типу, коли розробляють нейронну мережу.

Одна з найбільш поширених вправ дляперевірки нового методу машинного навчання: навчити ІІ розпізнавати об'єкти чи тварини на фотографії. Автори нової роботи провели експеримент: вони створили дві нові нейронні мережі, які мали розпізнавати десять різних типів об'єктів на колекції з 50 тис. фотографій. 

Перша система ІІ була навчена традиційним способом: у неї завантажили таблицю даних із тисяч рядків, кожен відповідав одній тренувальній фотографії. 

А в другу систему автори завантажили таблицюданих, рядки якої містили фотографію тварини або об'єкта, а в другій колонці був аудіофайл, на якому людина вимовляє назву об'єкта або тварини. 

В результаті перша нейромережа видавала цифрове.значення об'єкта, які їй показували, а друга намагалася «сказати» те, що вона бачила. Обидва алгоритми справлялися із завданням однаково ефективно та відповідали правильно у 92% випадків, зазначають автори. 

Однак результати експерименту змінилися, коливчені скоротили вибірку з 50 тис. до 2,5 тис. Тоді правильність відповідей першого ІІ впала до 35%, а у другого, який був навчений голосом, знизилася лише до 70%. 

Читати далі:

Дослідники вперше занурилися до самого глубоколежащих потонулого корабля

Створено першу точна карта світу. Що не так з усіма іншими?

З'явилася бездротова система, яка допомагає паралізованим