Нейросеть оживила портрет Достоевского

Исследователи из Центра искусственного интеллекта Samsung в Москве описали алгоритм создания «живых портретов» всего лишь из одной фотографии.

Проблему синтеза фотореалистичной анимации изучали исследователи Егор Захаров, Александра Шишея, Егор Бурков и Дмитрий Лемпицкий. Подобные алгоритмы применяются для телеприсутствия, включая видеоконференции, многопользовательские игры и индустрию спецэффектов.

Ожившая классика

Авторы называют свой метод «обучением в несколько приемов», когда алгоритм для создания убедительного анимационного портрета использует малое количество изначальных данных.

Исследователи, используя единственный исходный снимок, смогли оживить картины и знаменитые портреты. Федор Достоевский, который умер задолго до того, как кинокамеры стали доступными, двигается и говорит. После работы нейросети «оживает» и Таинственная незнакомка.

Почему это сложно

Синтезировать реалистичные анимированные портреты сложно по двум причинам:

человеческие головы имеют высокую фотометрическую, геометрическую и кинематическую сложность, поэтому моделировать лица сложно;
острота зрительной системы человека, которая заметит даже незначительные ошибки в мимике «смоделированной головы».

Поэтому обычно динамическому генератору изображений требуется большое количество фотографий с целевым объектом и времени на обработку данных. Разработка ученых из Центра искусственного интеллекта Samsung упрощает задачу создания «говорящих голов».

Суть работы

«Фотореалистичные модели говорящих голов» созданы с использованием сверточных нейронных сетей: алгоритм обучили на большом наборе видео говорящих голов с широким разнообразием видов. Для этого использовали общедоступные базы данных VoxCeleb, содержащие 7 тыс. изображений знаменитостей из видеороликов YouTube. Так программа учится распознавать черты лица: глаза, формы рта, длину и форму переносицы.

Как это работает

В процессе обучения система создает три нейронные сети: встроенная сеть делит кадры на векторы, сеть генераторов отображает лицевые ориентиры в синтезированном видео, а сеть дискриминатора оценивает реалистичность сгенерированных изображений.

Схема обучения алгоритма

На каждое лицо в кадре наложена маска, которая обозначает его границы и базовую мимику. Информация о том, как маска соотносится с исходным кадром, хранится в виде вектора, данные из которого используются для наложения маски на изображение человека, после чего готовое изображение сравнивается с первоисточником.

«Система определяет параметры как генератора, так и дискриминатора для каждого человека индивидуально, так что для обучения нейросети хватит нескольких изображений, несмотря на необходимость настройки десятков миллионов параметров. Мы показываем, что такой подход позволяет создавать реалистичные и персонализированные модели говорящих голов новых людей и даже портретные картины», – сообщают авторы в резюме статьи.

Подробнее о разработке

Если вам удобнее смотреть новости в телеграме, то вот наша группа – ИНФОСТАРТ.

Автор:

Сергей Кравченко

Обозреватель

В России научат ИИ проектировать цифровые интегральные микросхемы

+2 –

ИИ научат разработке цифровых интегральных микросхем – несколько российских научных институтов заявили об участии в проекте. Проект рассчитан на 3 года – с 2024 по 2026.

23.07.2024 1260 user1915669 0

Рост использования ИИ в России требует строительства новых дата-центров

+1 –

Новость Дата-центры Искусственный интеллект ИТ и 1С

Развитие искусственного интеллекта и цифровых сервисов в России стало причиной роста потребности в мощных центрах обработки данных. Эксперты прогнозируют, что дефицит ЦОД, который уже наблюдается сегодня, в ближайшие годы будет только усиливаться.

18.07.2024 1295 AnastasiaKl 0

«Сколково» объявил отбор перспективных ИИ-проектов для получения грантов

+3 –

Новость Искусственный интеллект ИТ и 1С

В 2024 году «Сколково» выделит пилотным проектам в сфере искусственного интеллекта гранты на общую сумму 554 млн рублей. В результате отбора финансирование получат проекты с применением ИИ в областях производства, операционной деятельности и в работе предоставляемых сервисов.

12.04.2024 2869 AnastasiaKl 3

Microsoft внедрила новые функции в GitHub Copilot и анонсировала Windows Copilot

+1 –

Новость GitHub Искусственный интеллект

ИИ-помощник для разработчиков GitHub Copilot теперь не только в реальном времени анализирует код, предлагает варианты для его улучшения и помогает найти решение проблем в разработке, но и показывает ссылки на репозитории, из которых взят код.

17.08.2023 1674 VKuser24342747 0

В JetBrains разработали ИИ-помощника для аналитиков данных

+1 –

Новость Аналитика Искусственный интеллект

JetBrains представила нейросеть Ask AI для онлайн-блокнота Datalore. Виртуальный ассистент способен генерировать код на нескольких языках, предлагать доработки и упрощать процесс аналитики данных.

16.08.2023 1367 VKuser24342747 0

Исследование: ChatGPT дает неправильный ответ на половину вопросов о программировании

+3 –

Новость Искусственный интеллект ИТ и 1С

Чат-бот OpenAI ошибается в 52% случаев, когда отвечает на вопросы по программированию. Однако делает это так убедительно, что пользователи не замечают ошибки.

14.08.2023 5300 VKuser24342747 5

«Сбер» открыл доступ к двум нейросетям для генерации текста

+2 –

Новость Искусственный интеллект ИТ и 1С

«Сбер» предоставил свободный доступ к языковой модели ruGPT-3.5, предназначенной для генерации текста на русском языке. Кроме того, стала доступна нейросеть mGPT, поддерживающая 61 язык, включая языки СНГ и малых народов России.

25.07.2023 1706 VKuser24342747 1

GitLab начала открытое тестирование ИИ-ассистента для написания кода

+1 –

Новость GIT Искусственный интеллект ИТ и 1С Языки программирования Программист

GitLab представила собственную нейросеть Code Suggestions, способную генерировать код по запросу на естественном языке. ИИ-помощник поддерживает работу с 13 языками программирования.

10.07.2023 2036 VKuser24342747 0

Оставьте свое сообщение

E-mail:

Москва: (495) 668-08-22
Санкт-Петербург: (812)309-06-46
Россия: 8-800-5555-256
Часы работы: с 8:00 до 19:00 по Мск (пн-пт).
Адрес главного офиса: Санкт-Петербург, ул. Бухарестская 30/32, ТЦ Континент, 5 этаж, оф. 5.61.
support@infostart.ru
infostart.ru

Нейросеть оживила портрет Достоевского

Ожившая классика

Почему это сложно

Суть работы

Как это работает

См. также