В Google научились увеличивать изображения в 16 раз с восстановлением деталей

Раньше увеличить видео с камер наблюдения в десятки раз получалось только у героев фильмов. Но теперь такая возможность существует и в реальной жизни – инженеры Google разработали прорывную технологию масштабирования изображений.

Из одного пикселя – шестнадцать

Исследователи команды Brain Team опубликовали статью «Создание высокоточных изображений с использованием диффузных моделей» в блоге Google AI, который посвящен разработкам в сфере искусственного интеллекта.

Концепцию диффузных моделей впервые предложили в 2015 году. До недавнего времени они уступали глубоким генеративным моделям, но сейчас специалисты представили впечатляющие результаты применения новых подходов.

Brain Team создала модели машинного обучения и натренировала их превращать фотографии с низким разрешением в максимально детализированные изображения. Исследователи использовали сразу несколько технологий. Например, в диффузных моделях SR3 сверхвысокое разрешение достигается посредством повторного уточнения.

Модель SR3 обучается процессу искажения изображений, при котором к оригинальной картинке низкого разрешения постепенно добавляется шум (пиксели случайных цветов, расположенные в произвольных местах). В какой-то момент на фото останется только чистый шум – все оригинальные пиксели замещаются.

Если модель понимает, как это произошло, то она с высокой точностью сможет реализовать обратную процедуру – убрать шум с изображения, а также повысить его разрешение. Результат работы технологии:

Специалисты обнаружили, что SR3 хорошо работает при масштабировании портретов и естественных изображений. При 8-кратном увеличении лиц коэффициент смешения модели достигает 50%: это значит, что в половине случаев оригинальное фото высокого разрешения не отличить от увеличенного. Существующие методы обеспечивают сходные результаты лишь в 34% случаев.

Исследователи улучшили SR3 и получили CDM – условно-классовую диффузную модель. Фактически это целый каскад моделей машинного обучения: первая генерирует данные с низким разрешением, а каждая следующая постепенно его повышает.

CDM обучили на выборке фотографий сети ImageNet. В наборе примеров можно увидеть, как каскадно масштабируются изображения: от картинки 32×32 пикселя до 64×64 пикселей, а затем до 256x256 пикселей. Снимок размером 64×64 пикселя может быть увеличен до 256×256 пикселей, а затем до 1024×1024 пикселей.

Потенциал решения

Технология поможет улучшить качество самых разных изображений – от старых кинолент до звонков по видеосвязи, от исторических фото прошлых веков до результатов медицинских исследований.

В Google признали, что модели порой ошибаются и неверно воспроизводят детали. Например, на восстановленном изображении высокого разрешения может не оказаться тонкой оправы очков или других изящных деталей – и как раз за счет этого человек поймет, что фото не оригинальное. Но результаты, представленные в репозиториях моделей, открывают широкие возможности для масштабирования фото и видео и дальнейшего развития технологий машинного обучения.

Репозиторий SR3
Репозиторий CDM

Если вам удобнее смотреть новости в телеграме, то вот наша группа – ИНФОСТАРТ.

Автор:

Ксения Шестакова

Обозреватель

Slack ушел – 1С-Коннект и другие российские мессенджеры занимают его место

+3 –

После ухода Slack из России в 2024 году бизнес стал переходить на отечественные корпоративные мессенджеры. Один из самых универсальных — 1С-Коннект. Расскажем подробнее о нём и других решениях российских разработчиков.

24.04.2025 1271 AnastasiaKl 5

Российские решения готовы занять место зарубежных в трех классах ИТ-средств

+3 –3

Новость ИТ-компания ИТ и 1С

С января по март 2025 года Ассоциация КП ПОО провела исследование отечественных систем виртуализации, коммуникации и контейнеризации по 266 показателям. Результаты показали, что медианная технологическая зрелость у этих ИТ-решений превышает 75%.

04.04.2025 1386 orenk0t 1

Минцифры планирует создать платформу для подтверждения навыков ИТ-специалистов

+2 –

Новость ИТ и 1С

Минцифры подготовило проект постановления по запуску платформы, на которой ИТ-специалисты могут пройти добровольное тестирование и подтвердить свою квалификацию.

11.12.2024 1556 user1915669 3

ФНС открыла бесплатный сервис для формирования машиночитаемых документов

+2 –

Новость ИТ и 1С ФНС ЭДО

Федеральная налоговая служба запустила интерактивный сервис, позволяющий формировать в машиночитаемом виде договоры, контракты, соглашения и спецификации. Чтобы создать документ и скачать получившийся файл, регистрация не требуется.

03.12.2024 1237 user2114475 0

Альянс по ИИ опубликовал новую модель с профессиями и компетенциями

+3 –

Новость ИТ и 1С

Российский Альянс по искусственному интеллекту обновил требования к специалистам по ИИ: вышла новая модель с основными профессиями и навыками. Теперь базовых профессий в сфере ИИ осталось только четыре.

01.11.2024 1550 user1915669 0

В России планируют внедрять новые системы безналичных расчетов: «Волна» и BRICS Pay

+4 –

Новость ИТ и 1С

Система платежей «Волна» по планам сделает возможной бесконтактную оплату для владельцев IPhone в России, а BRICS Pay позволит совершать безналичные расчеты иностранцам по картам Visa и Mastercard.

23.10.2024 1817 AnastasiaKl 0

Конструктор сайтов Wix уходит из России с 12 сентября

+2 –

Новость ИТ-компания ИТ и 1С

Конструктор сайтов Wix уходит из России с 12 сентября 2024 года – перестанут работать все российский аккаунты. Сайты, привязанные к аккаунтам, также перестанут работать.

11.09.2024 1595 user1915669 2

В России научат ИИ проектировать цифровые интегральные микросхемы

+2 –

Новость Искусственный интеллект ИТ и 1С

ИИ научат разработке цифровых интегральных микросхем – несколько российских научных институтов заявили об участии в проекте. Проект рассчитан на 3 года – с 2024 по 2026.

23.07.2024 1394 user1915669 0

Оставьте свое сообщение

E-mail:

Москва: (495) 668-08-22
Санкт-Петербург: (812)309-06-46
Россия: 8-800-5555-256
Часы работы: с 8:00 до 19:00 по Мск (пн-пт).
Адрес главного офиса: Санкт-Петербург, ул. Бухарестская 30/32, ТЦ Континент, 5 этаж, оф. 5.61.
support@infostart.ru
infostart.ru

В Google научились увеличивать изображения в 16 раз с восстановлением деталей

Из одного пикселя – шестнадцать

Потенциал решения

См. также