Искусственный интеллект научился распознавать изображения лучше человека

Искусственный интеллект научился распознавать изображения лучше человека
26.08.2021
15630

Алгоритм компьютерного зрения впервые превзошел человека. В экспериментах людям и системе искусственного интеллекта предлагали определить, что изображено на фото, и ответить на вопросы. Результат ИИ оказался выше, чем у человека.

Китайская Алиса

Китайский гигант электронной коммерции Alibaba Group Holding, который владеет AliExpress и другими крупными торговыми площадками, а также медиа и другими активами, разработал модель искусственного интеллекта AliceMind.

В создании системы сделали упор на распознавании изображений и генерации ответов на естественном языке. Эта область технологий называется VQA (Visual Question Answering) – визуальные ответы на вопросы. Она нашла применение во многих сферах – от поиска товаров в интернет-магазинах до автономного управления автомобилями и самолетами и анализа медицинских изображений для первоначальной диагностики заболеваний.

Наборы данных для тренировки VQA-моделей есть в открытом доступе в сети. Один из самых популярных и доступных – датасет от VirginiaTech с фото сцен из повседневной жизни и открытыми вопросами (на которые чаще всего нельзя ответить «да» или «нет»).

 

 

В Alibaba рассказали, что уже используют наработки в области VQA в своих программных продуктах. Например, в создании умного чат-бота Alime Shop Assistant для розничных платформ компании.

ИИ бьет рекорды

Продемонстрировать AliceMind в деле решили на международном конкурсе Visual Question Answering (VQA) Challenge 2021. Соревнования проводятся с 2015 года.

В этом году организаторы подготовили более 250 тыс. изображений и 1,1 млн вопросов. Каждое задание включало одну картинку и связанный с ней вопрос, на который и люди, и системы искусственного интеллекта должны были дать максимально точный ответ.

Люди успешно справились с 80,83% заданий. AliceMind удалось превзойти этот результат: система правильно ответила на 81,26% вопросов и заняла первое место на соревнованиях VQA.

Си Луо, руководитель отдела обработки естественного языка (NLP) в Alibaba DAMO Academy, отметил: «Мы гордимся тем, что достигли еще одной важной вехи в развитии искусственного интеллекта. Это не означает, что однажды люди будут заменены роботами. Скорее, более умные машины можно будет использовать для помощи в повседневной работе и жизни, и, следовательно, люди смогут сосредоточиться на творческих задачах».

Автор:
Обозреватель

См. также

Минцифры подготовило проект постановления по запуску платформы, на которой ИТ-специалисты могут пройти добровольное тестирование и подтвердить свою квалификацию.

11.12.2024    989    user1915669    3       

2

Федеральная налоговая служба запустила интерактивный сервис, позволяющий формировать в машиночитаемом виде договоры, контракты, соглашения и спецификации. Чтобы создать документ и скачать получившийся файл, регистрация не требуется.

03.12.2024    791    user2114475    0       

2

Российский Альянс по искусственному интеллекту обновил требования к специалистам по ИИ: вышла новая модель с основными профессиями и навыками. Теперь базовых профессий в сфере ИИ осталось только четыре.

01.11.2024    950    user1915669    0       

3

Система платежей «Волна» по планам сделает возможной бесконтактную оплату для владельцев IPhone в России, а BRICS Pay позволит совершать безналичные расчеты иностранцам по картам Visa и Mastercard.

23.10.2024    1258    AnastasiaKl    0       

4

Конструктор сайтов Wix уходит из России с 12 сентября 2024 года – перестанут работать все российский аккаунты. Сайты, привязанные к аккаунтам, также перестанут работать.

11.09.2024    1238    user1915669    2       

2

ИИ научат разработке цифровых интегральных микросхем – несколько российских научных институтов заявили об участии в проекте. Проект рассчитан на 3 года – с 2024 по 2026.

23.07.2024    872    user1915669    0       

2

Развитие искусственного интеллекта и цифровых сервисов в России стало причиной роста потребности в мощных центрах обработки данных. Эксперты прогнозируют, что дефицит ЦОД, который уже наблюдается сегодня, в ближайшие годы будет только усиливаться.

18.07.2024    988    AnastasiaKl    0       

1

В сентябре 2024 года видеоигры в России начнут маркировать – пока на добровольной основе. Геймерам будут сообщать о семи видах чувствительного (неприятного) контента в игре.

17.07.2024    1064    user1915669    0       

1

Комментарии

Инфостарт бот
1. Aftee 26.08.21 15:53 Сейчас в теме
Скорее, более умные машины можно будет использовать

вместо менее умных людей, которые не смогли правильно ответить на подобные вопросы к картинкам
2. starik-2005 26.08.21 16:27 Сейчас в теме
Люди одни и те же в разных состояниях могут быть по разному эффективны. А машина - она всегда одинаково эффективна, что делает ее работу однозначно прогнозируемой и более эффективной.
3. awk 26.08.21 16:49 Сейчас в теме
(2)Who is wearing glasses (first picture twice man, second twice woman)?

Answer: man, woman.

It's perfect.
4. sikuda 27.08.21 10:29 Сейчас в теме
Особенно эффективна когда помошник водителя в Тесле принимает луну за желтый свет и всегда притормаживает...
5. dka80 27.08.21 13:17 Сейчас в теме
(3) поглядим как она будет определять людей ассоциирующих себя с другим полом ))
antonpirogov; +1 Ответить

Оставьте свое сообщение