Розроблено технологію, що використовуючи систему нейромереж, дозволяє перетворити аудіозапис в повноцінне відео. Дослідники з Лабораторії обробки графіки і зображень (Graphics and Image Laboratory) Вашингтонського університету розробили ряд програмних алгоритмів, що дозволяють перетворити аудіозаписи в реалістичне відео, на якому людина синхронно рухає губами відповідно до вимовлених слів та фраз. В основі створеної системи лежить нейронна мережа, попередньо навчена на прикладах відео із записами людини, яка говорить на будь-яку тему.

 

Більш детальна інформація про систему перетворення аудіо в відео буде представлена на конференції з комп’ютерної графіки 2017 SIGGRAPH. А як приклад дослідники підготували вельми реалістичні ролики, на яких колишній президент США Барак Обама розмірковує на тему тероризму, батьківства, створення нових робочих місць і т.п. Ці відеоролики були побудовані на базі існуючих аудіозаписів, а для навчання нейронної мережі використовувалися багато годин записів публічних виступів Барака Обами.

В даний час нейронна мережа здатна навчитися імітації мови тільки однієї конкретної людини. Використання технологій штучного інтелекту дозволяє уникнути труднощів, що виникають при використанні традиційних конверсійних технологій. Адже для роботи традиційних технологій використовуються студійні записи безлічі різних людей, які повторюють одні й ті ж фрази, що робиться для визначення кореляції окремих вимовних звуків з формою, положенням губ і інших частин обличчя людини.

Така технологія перетворення мови в реалістичне відео може знайти застосування в різних системах конференц-зв’язку для поліпшення їх роботи, вважають дослідники. Адже для передачі тільки аудіо-сигналу потрібна набагато вужча смуга пропуску комунікаційного каналу, ніж для одночасної передачі аудіо та відео. Крім цього, нова технологія може забезпечити спілкування в режимі реального часу людей з віртуальними персонажами комп’ютерних ігор або історичних реконструкцій.

Поява системи, що забезпечує настільки реалістичний результат, відразу ж змушує задуматися про можливості в області фальсифікації, які вона надає. Однак, запевняють дослідники, застосувавши приблизно такий же підхід, тобто “згодувавши” навченій нейронній мережі відео для аналізу, можна без проблем з’ясувати, що це таке, реальна відеозйомка чи ролик, зроблений комп’ютером?