Компания Microsoft представила искусственный интеллект VALL-E, который может воспроизвести любой голос, передавая эмоции и тон говорящего.
Он может генерировать голосовые записи на основе трехсекундного образца. Исследование показало, что модель, обученная на основе множества коротких отрывков, генерирует английскую речь.
При этом голос имитируется очень достоверно, с сохранением как тембра, так и эмоциональной окраски оригинала, которую невозможно отличить от голоса оригинала.
VALL-E обучали на библиотеке LibriLight, содержащей 60 000 часов англоязычной речи более чем от 7000 человек. Это в сотни раз больше, чем у существующих аналогов.
Опасная технология
Группа исследователей, стоящих за VALL-E, в своей работе отмечает опасность разрабатываемой технологии в случае попадания ее в «неправильные руки».
В теории сее помощью мошенники могут обмануть системы идентификации личности или выдать себя, к примеру, за авторитетную публичную фигуру с целью ее дискредитации.
Одним из возможных решений данной проблемы ученые называют создание системы выявления «аудиофейков», то есть сгенерированных Vall-E голосовых сообщений.
Другими словами, Microsoft намерен сначала создать инструмент для подделки голоса человека, а потом – для распознавания подделки сделанной подделки?
По сообщению Semafor, корпорация Microsoft намерена инвестировать $10 млрд. в организацию OpenAI, которая занимается разработкой и лицензированием технологий на основе искусственного интеллекта.
Но главный вопрос – зачем всё-таки создан VALL-E?
И как же обещанная обществу безопасность сбора биометрии?
Источник: ixbt.com, hightech.fm, cnews.ru