OpenAI обучила нейросеть редактировать изображение по текстовому описанию

OpenAI показала результат работы программы GLIDE, которая способна внести изменения в готовое изображение по описанию с сохранением стиля и экспозиции. Также нейросеть может создавать уникальные картинки.

Как работает технология

Исследователи из OpenAI использовали для обучения нейросети 3,5 млрд параметров, при тестировании применяли классификатор CLIP, а также тестировали автономно. Второй подход показал более высокую эффективность и позволял создать выборку более высокого качества.

Также разработчики использовать диффузионные модели, чтобы добиться изменения конкретного участка изображения. Благодаря технологии нейросеть искажает исходную картинку, постепенно добавляя в нее гауссовский шум, а затем обращает этот процесс вспять, дорисовывая необходимые детали. Аналогичным образом работает ИИ от Google, который увеличивает разрешение.

Изменение изображения занимает несколько секунд. Во время работы алгоритм учитывает тени и отражения. Также нейросеть способна работать не только с фотографиями, но и авторскими иллюстрациями. В этом случае она будет пытаться адаптироваться к художественному стилю картины.

Результаты работы нейросети

Кроме того, GLIDE способна генерировать новые фотореалистичные изображения, объединять концепции правильным образом и осуществлять художественную визуализацию. По словам авторов проекта, программа выдает более предпочтительные образцы на 87% чаще, чем предыдущая разработка OpenAI для создания картинок с помощью ИИ DALL-E.

Особенности проекта

Результат генерации GLIDE зачастую практически не уступает работе человека, хорошо владеющего инструментами Photoshop. Нейросеть способна успешно обрабатывать достаточно сложные запросы вроде «повесить картину Ван Гога на стену», однако плохо справляется со странными и нетипичными описаниями, такими как «автомобиль с треугольными колесами».

Результаты исследования разработчиков доступны на научном портале arXiv.org. Исходный код сокращенной модели опубликован на GitHub и доступен для свободного тестирования.

Ранее свою нейросеть для генерации изображений под названием ruDALL-E представил «Сбер». Ключевое отличие российской разработки от иностранного аналога – возможность создавать картинки по описанию на русском языке, в то время как проект OpenAI работает только с английскими словами.

Если вам удобнее смотреть новости в телеграме, то вот наша группа – ИНФОСТАРТ.

Автор:

Александр Вашкевич

Аналитик

Хакатон «Лидеры цифровой трансформации»: открыт прием заявок

+3 –

Новость ИТ и 1С Бизнес-аналитик Программист

До 18 сентября подавайте заявку на цифровое событие года – хакатон «Лидеры цифровой трансформации». Участников ждут 20 задач от крупных компаний, 40 млн рублей призового фонда, 14 дней онлайн-кодинга и финальный фестиваль в Москве.

16.09.2025 1351 AnastasiaKl 0

Slack ушел – 1С-Коннект и другие российские мессенджеры занимают его место

+3 –

Новость Импортозамещение ИТ и 1С

После ухода Slack из России в 2024 году бизнес стал переходить на отечественные корпоративные мессенджеры. Один из самых универсальных — 1С-Коннект. Расскажем подробнее о нём и других решениях российских разработчиков.

24.04.2025 3154 AnastasiaKl 5

Российские решения готовы занять место зарубежных в трех классах ИТ-средств

+3 –3

Новость ИТ-компания ИТ и 1С

С января по март 2025 года Ассоциация КП ПОО провела исследование отечественных систем виртуализации, коммуникации и контейнеризации по 266 показателям. Результаты показали, что медианная технологическая зрелость у этих ИТ-решений превышает 75%.

04.04.2025 2777 orenk0t 1

Минцифры планирует создать платформу для подтверждения навыков ИТ-специалистов

+2 –

Новость ИТ и 1С

Минцифры подготовило проект постановления по запуску платформы, на которой ИТ-специалисты могут пройти добровольное тестирование и подтвердить свою квалификацию.

11.12.2024 3176 user1915669 3

ФНС открыла бесплатный сервис для формирования машиночитаемых документов

+2 –

Новость ИТ и 1С ФНС ЭДО

Федеральная налоговая служба запустила интерактивный сервис, позволяющий формировать в машиночитаемом виде договоры, контракты, соглашения и спецификации. Чтобы создать документ и скачать получившийся файл, регистрация не требуется.

03.12.2024 2621 user2114475 0

Альянс по ИИ опубликовал новую модель с профессиями и компетенциями

+3 –

Новость ИТ и 1С

Российский Альянс по искусственному интеллекту обновил требования к специалистам по ИИ: вышла новая модель с основными профессиями и навыками. Теперь базовых профессий в сфере ИИ осталось только четыре.

01.11.2024 2819 user1915669 0

В России планируют внедрять новые системы безналичных расчетов: «Волна» и BRICS Pay

+4 –

Новость ИТ и 1С

Система платежей «Волна» по планам сделает возможной бесконтактную оплату для владельцев iPhone в России, а BRICS Pay позволит совершать безналичные расчеты иностранцам по картам Visa и Mastercard.

23.10.2024 3426 AnastasiaKl 0

Конструктор сайтов Wix уходит из России с 12 сентября

+2 –

Новость ИТ-компания ИТ и 1С

Конструктор сайтов Wix уходит из России с 12 сентября 2024 года – перестанут работать все российский аккаунты. Сайты, привязанные к аккаунтам, также перестанут работать.

11.09.2024 3192 user1915669 2

Для отправки сообщения требуется регистрация/авторизация

OpenAI обучила нейросеть редактировать изображение по текстовому описанию

Как работает технология

Результаты работы нейросети

Особенности проекта

См. также

Журнал

База знаний

Лаборатория

Анализ & Управление

Сопровождение 1С

Корпоративные решения

Обучение

Маркетплейс

Проектный офис