OpenAI обучила нейросеть редактировать изображение по текстовому описанию

29.12.2021      16039

OpenAI показала результат работы программы GLIDE, которая способна внести изменения в готовое изображение по описанию с сохранением стиля и экспозиции. Также нейросеть может создавать уникальные картинки. 

Как работает технология

Исследователи из OpenAI использовали для обучения нейросети 3,5 млрд параметров, при тестировании применяли классификатор CLIP, а также тестировали автономно. Второй подход показал более высокую эффективность и позволял создать выборку более высокого качества. 

Также разработчики использовать диффузионные модели, чтобы добиться изменения конкретного участка изображения. Благодаря технологии нейросеть искажает исходную картинку, постепенно добавляя в нее гауссовский шум, а затем обращает этот процесс вспять, дорисовывая необходимые детали. Аналогичным образом работает ИИ от Google, который увеличивает разрешение. 

Изменение изображения занимает несколько секунд. Во время работы алгоритм учитывает тени и отражения. Также нейросеть способна работать не только с фотографиями, но и авторскими иллюстрациями. В этом случае она будет пытаться адаптироваться к художественному стилю картины.

 

 

Результаты работы нейросети

Кроме того, GLIDE способна генерировать новые фотореалистичные изображения, объединять концепции правильным образом и осуществлять художественную визуализацию. По словам авторов проекта, программа выдает более предпочтительные образцы на 87% чаще, чем предыдущая разработка OpenAI для создания картинок с помощью ИИ DALL-E.

Особенности проекта

Результат генерации GLIDE зачастую практически не уступает работе человека, хорошо владеющего инструментами Photoshop. Нейросеть способна успешно обрабатывать достаточно сложные запросы вроде «повесить картину Ван Гога на стену», однако плохо справляется со странными и нетипичными описаниями, такими как «автомобиль с треугольными колесами».

Результаты исследования разработчиков доступны на научном портале arXiv.org. Исходный код сокращенной модели опубликован на GitHub и доступен для свободного тестирования. 

Ранее свою нейросеть для генерации изображений под названием ruDALL-E представил «Сбер». Ключевое отличие российской разработки от иностранного аналога – возможность создавать картинки по описанию на русском языке, в то время как проект OpenAI работает только с английскими словами.


Автор:
Аналитик


См. также

Новость Искусственный интеллект ИТ-Новость

ИИ научат разработке цифровых интегральных микросхем – несколько российских научных институтов заявили об участии в проекте. Проект рассчитан на 3 года – с 2024 по 2026.

23.07.2024    198    user1915669    0       

1

Новость Дата-центры Искусственный интеллект ИТ-Новость

Развитие искусственного интеллекта и цифровых сервисов в России стало причиной роста потребности в мощных центрах обработки данных. Эксперты прогнозируют, что дефицит ЦОД, который уже наблюдается сегодня, в ближайшие годы будет только усиливаться.

18.07.2024    357    AnastasiaKl    0       

1

Новость ИТ-Новость

В сентябре 2024 года видеоигры в России начнут маркировать – пока на добровольной основе. Геймерам будут сообщать о семи видах чувствительного (неприятного) контента в игре.

17.07.2024    410    user1915669    0       

1

Новость Законодательство ИТ-Новость

Депутаты Госдумы работают над законопроектом по ужесточению контроля за электросамокатами. Среди мер: обязательная регистрация СИМ (средств индивидуальной мобильности) и разработка системы отслеживания их перемещений.

10.07.2024    521    AnastasiaKl    2       

1

Новость Искусственный интеллект ИТ-Новость

В 2024 году «Сколково» выделит пилотным проектам в сфере искусственного интеллекта гранты на общую сумму 554 млн рублей. В результате отбора финансирование получат проекты с применением ИИ в областях производства, операционной деятельности и в работе предоставляемых сервисов.

12.04.2024    1057    AnastasiaKl    3       

3

Новость ИТ-Новость

Пятничное: в России вступил в силу стандарт подготовки по дисциплине «спортивное программирование». В стандарт вошли требования к физическим показателям спортсменов и скорости набора текста.

16.02.2024    858    VKuser24342747    2       

1

Новость ИТ-Новость

Федеральное агентство по техническому регулированию и метрологии (Росстандарт) утвердило национальный стандарт протокола LoRaWAN RU, таким образом он получил официальный статус. Технология используется для беспроводной передачи данных между устройствами интернета вещей.

19.01.2024    651    VKuser24342747    0       

2

Новость Законодательство ИТ-Новость

12 декабря вступил в силу Федеральный закон, меняющий срок, к которому все владельцы сайтов должны внести изменения в порядок авторизации пользователей на сайте. Закон вводит переходный период до 1 января 2025 года.

20.12.2023    795    VKuser24342747    2       

1
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
Оставьте свое сообщение