Искусственный интеллект научился распознавать изображения лучше человека

Алгоритм компьютерного зрения впервые превзошел человека. В экспериментах людям и системе искусственного интеллекта предлагали определить, что изображено на фото, и ответить на вопросы. Результат ИИ оказался выше, чем у человека.
Китайская Алиса
Китайский гигант электронной коммерции Alibaba Group Holding, который владеет AliExpress и другими крупными торговыми площадками, а также медиа и другими активами, разработал модель искусственного интеллекта AliceMind.
В создании системы сделали упор на распознавании изображений и генерации ответов на естественном языке. Эта область технологий называется VQA (Visual Question Answering) – визуальные ответы на вопросы. Она нашла применение во многих сферах – от поиска товаров в интернет-магазинах до автономного управления автомобилями и самолетами и анализа медицинских изображений для первоначальной диагностики заболеваний.
Наборы данных для тренировки VQA-моделей есть в открытом доступе в сети. Один из самых популярных и доступных – датасет от VirginiaTech с фото сцен из повседневной жизни и открытыми вопросами (на которые чаще всего нельзя ответить «да» или «нет»).
В Alibaba рассказали, что уже используют наработки в области VQA в своих программных продуктах. Например, в создании умного чат-бота Alime Shop Assistant для розничных платформ компании.
ИИ бьет рекорды
Продемонстрировать AliceMind в деле решили на международном конкурсе Visual Question Answering (VQA) Challenge 2021. Соревнования проводятся с 2015 года.
В этом году организаторы подготовили более 250 тыс. изображений и 1,1 млн вопросов. Каждое задание включало одну картинку и связанный с ней вопрос, на который и люди, и системы искусственного интеллекта должны были дать максимально точный ответ.
Люди успешно справились с 80,83% заданий. AliceMind удалось превзойти этот результат: система правильно ответила на 81,26% вопросов и заняла первое место на соревнованиях VQA.
Си Луо, руководитель отдела обработки естественного языка (NLP) в Alibaba DAMO Academy, отметил: «Мы гордимся тем, что достигли еще одной важной вехи в развитии искусственного интеллекта. Это не означает, что однажды люди будут заменены роботами. Скорее, более умные машины можно будет использовать для помощи в повседневной работе и жизни, и, следовательно, люди смогут сосредоточиться на творческих задачах».
См. также
Банк России добавил поддержку NFC-технологии в Систему быстрых платежей
сегодня в 17:11 467 VKuser24342747 0
GitHub до конца 2023 года полностью перейдет на двухфакторную аутентификацию
12.05.2022 3718 VKuser24342747 0
В России создан алгоритм принятия решений о необходимости обновления критичного ПО
21.04.2022 2223 VKuser24342747 0
ИТ-отрасль представила Минцифры список приоритетных направлений поддержки
15.04.2022 2491 VKuser24342747 1
В России разработали открытую операционную систему «Фантом» на собственном микроядре
02.02.2022 6272 user1015646 2
Let's Encrypt отозвал 2 миллиона сертификатов из-за нарушений в коде
02.02.2022 6101 VKuser24342747 0
Google представила новый сервис на замену непопулярной технологии FLoC
01.02.2022 7038 VKuser24342747 0
Samsung разработала модуль биометрической аутентификации для смарт-карт
28.01.2022 7381 VKuser24342747 0
Apple отложила требование об обязательном удалении аккаунтов в приложениях
27.01.2022 10982 VKuser24342747 0
Минцифры разработает единый стандарт для умных многоквартирных домов
24.01.2022 6486 VKuser24342747 0
Visa разработала способ превратить почти любое устройство в POS-терминал
21.01.2022 6910 VKuser24342747 0
Производитель «Эльбрусов» раскритиковал отсрочку внедрения российских процессоров
18.01.2022 6402 VKuser24342747 0