Нейросеть научили создавать изображения по текстовому описанию

19.01.2021      12295

Разработчики компании OpenAI представили нейронную сеть DALL-E. Она анализирует англоязычный текст и создает изображения на его основе. 

В духе великого испанца

Создатели назвали нейросеть в честь испанского художника Сальвадора Дали и робота WALL-E из мультфильма Pixar. 

DALL-E успешно справится даже со странными запросами. Вот так, например, выглядит кресло в форме авокадо:

 

 

А так – улитка в виде арфы:

 

Как работает нейросеть

В основу DALL-Е легла архитектура нейросети GPT-3, которая создает тексты на основе заданных параметров. Эта сеть неделю выдавала себя за человека, генерируя посты для блога. 

DALL-E – расширение GPT-3 – задействует 12 млрд параметров. Она умеет анализировать текстовые запросы, находить в них объекты и смыслы, составлять изображения, пользуясь базой основных картинок. 

Формально на вход поступает 1280 токенов: 256 содержат текст, 1024 – фрагменты изображения. Затем нейросеть по авторегрессионной модели создает новые картинки. 

Основные навыки

DALL-Е может создавать картины с одним или несколькими объектами, передавать объем и перспективу, восстанавливать фото по его части. При создании фото она учитывает местные особенности: например, национальной еды или пейзажей. 

Нейросеть добавляет надписи в различных стилях на дорожные знаки или рекламные таблички. 

Кроме того, DALL-E умеет достраивать недостающие фрагменты изображений. Например, для решения задачи на уровень IQ. 

 

 

Разработчики подчеркнули: DALL-Е понимает сложные фразы и способна генерировать абстракции. В результате создаются объекты, которых не существует в реальном мире – речь идет именно о генерации, а не о наилучшей поисковой выдаче. 

В OpenAI отметили, что в будущем собираются применять DALL-E и подобные ей нейросети для решения мировых проблем. Например, прогнозировать востребованность профессий, как будут развиваться производства и экономика в целом.


Автор:
Обозреватель


См. также

Новость ИТ-Новость

Минцифры подготовило проект постановления по запуску платформы, на которой ИТ-специалисты могут пройти добровольное тестирование и подтвердить свою квалификацию.

11.12.2024    454    user1915669    2       

2

Новость ИТ-Новость ФНС ЭДО

Федеральная налоговая служба запустила интерактивный сервис, позволяющий формировать в машиночитаемом виде договоры, контракты, соглашения и спецификации. Чтобы создать документ и скачать получившийся файл, регистрация не требуется.

03.12.2024    564    user2114475    0       

2

Новость ИТ-Новость

Российский Альянс по искусственному интеллекту обновил требования к специалистам по ИИ: вышла новая модель с основными профессиями и навыками. Теперь базовых профессий в сфере ИИ осталось только четыре.

01.11.2024    785    user1915669    0       

3

Новость ИТ-Новость

Система платежей «Волна» по планам сделает возможной бесконтактную оплату для владельцев IPhone в России, а BRICS Pay позволит совершать безналичные расчеты иностранцам по картам Visa и Mastercard.

23.10.2024    1000    AnastasiaKl    0       

4

Новость ИТ-компания ИТ-Новость

Конструктор сайтов Wix уходит из России с 12 сентября 2024 года – перестанут работать все российский аккаунты. Сайты, привязанные к аккаунтам, также перестанут работать.

11.09.2024    1006    user1915669    2       

2

Новость Искусственный интеллект ИТ-Новость

ИИ научат разработке цифровых интегральных микросхем – несколько российских научных институтов заявили об участии в проекте. Проект рассчитан на 3 года – с 2024 по 2026.

23.07.2024    642    user1915669    0       

2

Новость Дата-центры Искусственный интеллект ИТ-Новость

Развитие искусственного интеллекта и цифровых сервисов в России стало причиной роста потребности в мощных центрах обработки данных. Эксперты прогнозируют, что дефицит ЦОД, который уже наблюдается сегодня, в ближайшие годы будет только усиливаться.

18.07.2024    788    AnastasiaKl    0       

1

Новость ИТ-Новость

В сентябре 2024 года видеоигры в России начнут маркировать – пока на добровольной основе. Геймерам будут сообщать о семи видах чувствительного (неприятного) контента в игре.

17.07.2024    857    user1915669    0       

1
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
Оставьте свое сообщение