«Сбер» представил нейросеть для генерации картинок по описанию

Сервис ruDALL-E способен генерировать изображения с нуля по текстовому описанию на русском языке. Авторы полагают, что модель будет полезна для создания рекламного, архитектурного и промышленного дизайна.

Как работает

Нейросеть обучена одновременно на двух типах данных: иллюстрациях и текстовых материалах. Благодаря этому она способна генерировать неограниченное количество новых изображений по описанию, введенному пользователем. Опробовать результат машинного обучения можно на официальном сайте сервиса ruDALL-E.

Создание картинки проходит в три этапа. Сперва нейросеть обрабатывает введенный текст и генерирует определенное число иллюстраций. После этого алгоритм отбирает из получившихся вариантов наиболее удачные и подходящие под описание. На финальной стадии программа улучшает качество отобранного изображения, увеличивает его в размере и демонстрирует пользователю.

Примеры генерации нейросети по описанию «Ежик в тумане»

Подробности разработки

В разработке ruDALL-E принимали участие команды SberDevices, Sber AI и SberCloud. Разработчики на базе публикации OpenAI воспроизвели код и смогли запустить обучение нейросети на платформе ML Space, которая работает на мощностях суперкомпьютера «Кристофари».

В итоге проект «Сбера» стал самой большой моделью такого рода в мире, которая способна работать с русскими описаниями. Процесс обучения занял 24 тысячи GPU-часов, за это время программа обработала массив данных из 120 миллионов пар «текст-изображение».

По словам Давида Рафаловского, исполнительного вице-президента «Сбербанка» и руководителя блока «Технологии», проект ruDALL-E – настоящий прорыв для русскоязычной индустрии. Еще два года назад постановку подобной задачи было невозможно вообразить.

Результат генерации по запросу «1С программист»

Открытые модели

Сейчас у разработчиков готовы две модели разного размера, которые получили имена двух известных российских художников-абстракционистов – Василия Кандинского и Казимира Малевича:

ruDALL-E Kandinsky (XXL), содержащая 12 миллиардов параметров;
ruDALL-E Malevich (XL) с 1,3 миллиардов параметров.

Модель XL уже можно бесплатно скачать с Github и использовать. Также в open source «Сбер» выложил еще несколько своих разработок, связанных с генерацией изображений:

Также команда разработчиков рассказала о масштабах проделанной работы. Модель ruDALL-E Kandinsky прошла обучение в 37 дней на базе оборудования с 512 GPU TESLA V100, а после дообучалась 11 дней на 128 GPU TESLA V100. Всего подготовка модели заняла 20 352 GPU-дней. Для подготовки ruDALL-E Malevich потребовалось 8 дней и устройства с 128 GPU TESLA V100, а потом еще 15 дней на 192 GPU TESLA V100, что в сумме составило 3 904 GPU-дня.

Результат генерации по запросу «Инфостарт»

Если вам удобнее смотреть новости в телеграме, то вот наша группа – ИНФОСТАРТ.

Автор:

Александр Вашкевич

Аналитик

Slack ушел – 1С-Коннект и другие российские мессенджеры занимают его место

+3 –

После ухода Slack из России в 2024 году бизнес стал переходить на отечественные корпоративные мессенджеры. Один из самых универсальных — 1С-Коннект. Расскажем подробнее о нём и других решениях российских разработчиков.

24.04.2025 1290 AnastasiaKl 5

Российские решения готовы занять место зарубежных в трех классах ИТ-средств

+3 –3

Новость ИТ-компания ИТ и 1С

С января по март 2025 года Ассоциация КП ПОО провела исследование отечественных систем виртуализации, коммуникации и контейнеризации по 266 показателям. Результаты показали, что медианная технологическая зрелость у этих ИТ-решений превышает 75%.

04.04.2025 1389 orenk0t 1

Минцифры планирует создать платформу для подтверждения навыков ИТ-специалистов

+2 –

Новость ИТ и 1С

Минцифры подготовило проект постановления по запуску платформы, на которой ИТ-специалисты могут пройти добровольное тестирование и подтвердить свою квалификацию.

11.12.2024 1573 user1915669 3

ФНС открыла бесплатный сервис для формирования машиночитаемых документов

+2 –

Новость ИТ и 1С ФНС ЭДО

Федеральная налоговая служба запустила интерактивный сервис, позволяющий формировать в машиночитаемом виде договоры, контракты, соглашения и спецификации. Чтобы создать документ и скачать получившийся файл, регистрация не требуется.

03.12.2024 1242 user2114475 0

Альянс по ИИ опубликовал новую модель с профессиями и компетенциями

+3 –

Новость ИТ и 1С

Российский Альянс по искусственному интеллекту обновил требования к специалистам по ИИ: вышла новая модель с основными профессиями и навыками. Теперь базовых профессий в сфере ИИ осталось только четыре.

01.11.2024 1579 user1915669 0

В России планируют внедрять новые системы безналичных расчетов: «Волна» и BRICS Pay

+4 –

Новость ИТ и 1С

Система платежей «Волна» по планам сделает возможной бесконтактную оплату для владельцев iPhone в России, а BRICS Pay позволит совершать безналичные расчеты иностранцам по картам Visa и Mastercard.

23.10.2024 1828 AnastasiaKl 0

Конструктор сайтов Wix уходит из России с 12 сентября

+2 –

Новость ИТ-компания ИТ и 1С

Конструктор сайтов Wix уходит из России с 12 сентября 2024 года – перестанут работать все российский аккаунты. Сайты, привязанные к аккаунтам, также перестанут работать.

11.09.2024 1599 user1915669 2

В России научат ИИ проектировать цифровые интегральные микросхемы

+2 –

Новость Искусственный интеллект ИТ и 1С

ИИ научат разработке цифровых интегральных микросхем – несколько российских научных институтов заявили об участии в проекте. Проект рассчитан на 3 года – с 2024 по 2026.

23.07.2024 1409 user1915669 0

Оставьте свое сообщение

E-mail:

Москва: (495) 668-08-22
Санкт-Петербург: (812)309-06-46
Россия: 8-800-5555-256
Часы работы: с 8:00 до 19:00 по Мск (пн-пт).
Адрес главного офиса: Санкт-Петербург, ул. Бухарестская 30/32, ТЦ Континент, 5 этаж, оф. 5.61.
support@infostart.ru
infostart.ru

«Сбер» представил нейросеть для генерации картинок по описанию

Как работает

Подробности разработки

Открытые модели

См. также