• Опубликовано:

Синтезатор речи Lyrebird может имитировать голос любого человека

Канадские ученые из Монреальского института изучения алгоритмов анонсировали любопытный компьютерный синтезатор речи Lyrebird, главной особенностью которого является имитация узнаваемой человеческой речи. Когда синтезатор речи будет доведен до ума, то С его помощью можно будет создавать аудиозаписи произвольного содержания с заранее выбранным голосом.

Весь процесс обучения Lyrebird длится одну минуту. Для того, чтобы скопировать речь конкретного человека, Lyrebird достаточно «слушать» его речь в течение одной минуты. После этого синтезатор может достаточно точно воспроизводить слова и фразы, при прослушивании которых ни у кого не возникнет сомнений в том, кто их произносит. Хотя, от компьютерной составляющей в речи разработчикам избавиться также пока не удалось.

Для обучения Lyrebird использует ресурсы графических карт, которые, как известно, более производительные в узких задачах чем CPU. Пока скорость генерации составляет около 1000 предложений в 0,5 секунды. Но главное не это: ученые хотят добиться того, чтобы синтезатор мог на 100% копировать человеческую речь, хотя в будущем это может вызывать конфузы как дипломатического, так и этического свойства.

Пример синтезированной речи Lyrebird можно прослушать здесь.

Источник: pcmag.com