AI на Microsoft имитира всеки глас въз основа на трисекунден запис

Microsoft представи изкуствен интелект VALL-E. Може да генерира гласови записи въз основа на

три секунди проба. Проучването установи, че модел, обучен на много кратки откъси, генерира английска реч, която е неразличима от оригиналния глас.

Изследователи от университета Корнелизползва модела VALL-E, за да анализира механизмите на генериране на реч. В своята работа, чийто препринт е публикуван на сървъра arXiv, учените изследват невронна мрежа, обучена на базата на 60 000 часа английска реч. Това е стотици пъти повече от съществуващите аналози.

Как работи AI. Изображение: VALL-E

Анализът показа, че системата има достатъчнотрисекунден клип за имитиране на гласа на събеседника. В същото време Vall-E далеч превъзхожда днешната TTS система по отношение на естественото звучене на речта и сходството на гласа. Освен това може да запази емоциите на говорещия и акустичната среда (влиянието на акустичните свойства на помещението, в което е направен оригиналният запис).

Разработената система за генериране все още е затворенапубличен достъп, но изследователите са публикували примери на проби и готови гласови файлове на сайта в Интернет. Образците от генерирана реч се различават по качество. Докато някои звучат естествено, други звучат машинно генерирани. Авторите на разработката отбелязват, че по-нататъшното обучение на различни гласове, включително с различни акценти, ще подобри качеството на системата.

Пример за човешки глас. Аудио: VALL-E

Генериран запис, който запазва външния шум. Аудио: VALL-E

Изследователите също така отбелязват, че възможносттагенерирането на гласове, които са идентични с оригиналите, създава нови предизвикателства пред сигурността, тъй като може да бъде използвано от измамници. Те вярват, че преди моделът да бъде широко пуснат на обществеността, трябва да се разработи система, която да разпознава генерирани от AI записи.

Прочетете още:

Тайната на издръжливостта на римския бетон е разкрита: той може да бъде реставриран

Генетиците са установили как възрастта на зачеването при хората се е променила за 250 000 години

Слънцето откри годината с проблясък от най-мощен клас