Разработана технология, позволяющая превратить аудиозапись в полноценное видео говорящего человека - «Наука и технологии» » Экономические новости.
Экономические новости. » Экономические новости » Технологии » Разработана технология, позволяющая превратить аудиозапись в полноценное видео говорящего человека - «Наука и технологии»
Разработана технология, позволяющая превратить аудиозапись в полноценное видео говорящего человека - «Наука и технологии»
Исследователи из Лаборатории обработки графики и изображений (Graphics and Image Laboratory) Вашингтонского университета разработали ряд программных алгоритмов, позволяющих преобразовать аудиозаписи в реалистичное видео, на котором человек синхронно двигает губами в соответствии с произносимыми
Кадры видео

Исследователи из Лаборатории обработки графики и изображений (Graphics and Image Laboratory) Вашингтонского университета разработали ряд программных алгоритмов, позволяющих преобразовать аудиозаписи в реалистичное видео, на котором человек синхронно двигает губами в соответствии с произносимыми словами и фразами. В основе созданной системы лежит нейронная сеть, предварительно обученная на примерах видео с записями человека, который говорит на любую тему.

Более детальная информация о системе преобразования аудио в видео будет представлена на конференции по компьютерной графике 2017 SIGGRAPH. А в качестве примера исследователи подготовили весьма реалистичные ролики, на которых бывший президент США Барак Обама рассуждает на тему терроризма, отцовства, создания новых рабочих мест и т.п. Эти видеоролики были построены на базе существующих аудиозаписей, а для обучения нейронной сети использовались многие часы записей публичных выступлений Барака Обамы.

В настоящее время нейронная сеть способна обучиться имитации речи только одного конкретного человека. Тем не менее, использование технологий искусственного интеллекта позволяет избежать трудностей, возникающих при использовании традиционных конверсионных технологий. Ведь для работы традиционных технологий используются студийные записи множества разных людей, повторяющих одни и те же фразы, что делается для определения корреляции отдельных произносимых звуков с формой, положением губ и других частей лица человека.

Процесс преобразования

{full-story limit="10000"}
Ctrl
Enter
Заметили ошЫбку?
Выделите текст и нажмите Ctrl+Enter
Мы в
Комментарии
Минимальная длина комментария - 50 знаков. комментарии модерируются
Комментариев еще нет. Вы можете стать первым!
Кликните на изображение чтобы обновить код, если он неразборчив


       
Экономические новости