Алгоритм компьютерного зрения впервые превзошел человека. В экспериментах людям и системе искусственного интеллекта предлагали определить, что изображено на фото, и ответить на вопросы. Результат ИИ оказался выше, чем у человека.
Китайская Алиса
Китайский гигант электронной коммерции Alibaba Group Holding, который владеет AliExpress и другими крупными торговыми площадками, а также медиа и другими активами, разработал модель искусственного интеллекта AliceMind.
В создании системы сделали упор на распознавании изображений и генерации ответов на естественном языке. Эта область технологий называется VQA (Visual Question Answering) – визуальные ответы на вопросы. Она нашла применение во многих сферах – от поиска товаров в интернет-магазинах до автономного управления автомобилями и самолетами и анализа медицинских изображений для первоначальной диагностики заболеваний.
Наборы данных для тренировки VQA-моделей есть в открытом доступе в сети. Один из самых популярных и доступных – датасет от VirginiaTech с фото сцен из повседневной жизни и открытыми вопросами (на которые чаще всего нельзя ответить «да» или «нет»).
В Alibaba рассказали, что уже используют наработки в области VQA в своих программных продуктах. Например, в создании умного чат-бота Alime Shop Assistant для розничных платформ компании.
ИИ бьет рекорды
Продемонстрировать AliceMind в деле решили на международном конкурсе Visual Question Answering (VQA) Challenge 2021. Соревнования проводятся с 2015 года.
В этом году организаторы подготовили более 250 тыс. изображений и 1,1 млн вопросов. Каждое задание включало одну картинку и связанный с ней вопрос, на который и люди, и системы искусственного интеллекта должны были дать максимально точный ответ.
Люди успешно справились с 80,83% заданий. AliceMind удалось превзойти этот результат: система правильно ответила на 81,26% вопросов и заняла первое место на соревнованиях VQA.
Си Луо, руководитель отдела обработки естественного языка (NLP) в Alibaba DAMO Academy, отметил: «Мы гордимся тем, что достигли еще одной важной вехи в развитии искусственного интеллекта. Это не означает, что однажды люди будут заменены роботами. Скорее, более умные машины можно будет использовать для помощи в повседневной работе и жизни, и, следовательно, люди смогут сосредоточиться на творческих задачах».