Компания Microsoft представила искусственный интеллект VALL-E, который может воспроизвести любой голос, передавая эмоции и тон говорящего.

Он может генерировать голосовые записи на основе трехсекундного образца. Исследование показало, что модель, обученная на основе множества коротких отрывков, генерирует английскую речь.

При этом голос имитируется очень достоверно, с сохранением как тембра, так и эмоциональной окраски оригинала, которую невозможно отличить от голоса оригинала.

VALL-E обучали на библиотеке LibriLight, содержащей 60 000 часов англоязычной речи более чем от 7000 человек. Это в сотни раз больше, чем у существующих аналогов.

Опасная технология

Группа исследователей, стоящих за VALL-E, в своей работе отмечает опасность разрабатываемой технологии в случае попадания ее в «неправильные руки».

В теории сее помощью мошенники могут обмануть системы идентификации личности или выдать себя, к примеру, за авторитетную публичную фигуру с целью ее дискредитации.

Одним из возможных решений данной проблемы ученые называют создание системы выявления «аудиофейков», то есть сгенерированных Vall-E голосовых сообщений.

Другими словами, Microsoft намерен сначала создать инструмент для подделки голоса человека, а потом – для распознавания подделки сделанной подделки?

 

По сообщению Semafor, корпорация Microsoft намерена инвестировать $10 млрд. в организацию OpenAI, которая занимается разработкой и лицензированием технологий на основе искусственного интеллекта.

Но главный вопрос – зачем всё-таки создан VALL-E? 

И как же обещанная обществу безопасность сбора биометрии?

Источник: ixbt.comhightech.fmcnews.ru