В Alibaba научили речевой алгоритм изолировать голоса в шумной толпе

07.12.2018     

Китайский конгломерат Alibaba все чаще обращает свое внимание на искусственный интеллект. На конференции NeurIPS 2018 в Монреале он представил презентацию о своих достижениях в прикладном использовании ИИ.

Искусственный интеллект и 40 разбойников

В марте 2017 года Alibaba запускает подразделение служб ИИ для здравоохранения и производства, а в сентябре подразделение Alibaba Cloud обнародовало планы создания специализированной дочерней компании и саморазвивающегося чипа вывода AI для логистики и автономного вождения. В июле 2018 стало известно, что Alibaba начал использовать ИИ при написании продающих текстов.

Имея достаточно ресурсов, компания активно развивает цифровые сервисы на базе искусственного интеллекта.

 

 

Он узнает тебя по голосу

Декан Института данных Alibaba Ронг Джин в ходе конференции NeurIPS заявил, что AI помогает решать интересные задачи. И одна из таких задач – распознавание речи в шумных местах, например, переполненное метро или перегруженный торговый центр.

Решение Alibaba – это комплекс из аппаратного и программного обеспечения: микрофонный массив с дальним полем и сложные алгоритмы глубокого обучения, которые изолируют голоса в толпе, снижая частоту ошибок.

«Лучшие» технологии распознавания речи способны достичь с помощью микрофонной матрицы 84% точности, Alibaba утверждает, что точность ее модели находится в пределах 94-95%. Комплекс уже развернут в рамках системы голосового взаимодействия в метро Шанхая, и компания ведет переговоры, чтобы использовать ее в других городах.

Применение

Голосовое взаимодействие в транспорте – не единственное направление, в котором Alibaba применяет искусственный интеллект. Используя обработку естественного языка, ИИ выполняет автоматический перевод в реальном времени в облаке, так что розничные клиенты компании в России и Малайзии могут общаться с агентами на их родных языках. Эти алгоритмы основаны на данных десятков тысяч звонков, которые центры поддержки получают каждый день с помощью интеллектуального механизма обслуживания клиентов AliMe.

 

 

AliMe, как и Google Duplex, может вести телефонный разговор и отвечать на вопросы без участия человека. Также он может автоматически извлекать текст и изображения из прилагаемого документа.

В ходе демонстрации в Монреале Ронг Джин попросил чат-бот Dian Xiaomi рассказать о рекламных акциях для конкретного Bluetooth-динамика. Бот рассказал, какие бесплатные подарки клиенты получат при покупке, и как они будут доставлены. Еще одна демонстрация представила гуманоидное воплощение чат-бота – прототип с координированными движениями глаз, губ и головы. Dian Xiaomi обслуживает почти 3,5 миллиона пользователей в день.

И глаз как у орла

Для складского учета и поиска изображений Alibaba использует масштабируемую архитектуру компьютерного зрения, чтобы обработать сотни миллионов объектов. Его алгоритм поиска облачных изображений может распознавать идентичные картинки. Приложение для управления магазином выбирает несколько элементов на полке для создания сводки и включает в себя распределение разных брендов, может обнаруживать 100 тыс. идентификаторов товарных позиций с высокой точностью.

Эти инструменты дополняют Alibaba Ali Smart Supply Chain (ASSC) – набор инструментов AI, которые помогают продавцам прогнозировать спрос на продукт, распределять ресурсы и выбирать стратегии ценообразования. Работа машинного зрения Alibaba распространяется и на спутниковые снимки. Alibaba Ali Smart Supply Chain использует данные, собранные от AutoNavi, крупнейшего поставщика карт и навигации в Китае, насчитывающего 70 млн пользователей. Его системы могут идентифицировать недавно построенные здания и собирать информацию, связанную с дорожными работами и достопримечательностями.

 

 

Alibaba также использует компьютерное зрение, чтобы предотвратить кражи в магазинах. Алгоритм глубокого обучения AliFPGA-X100 работает на программируемой пользователем интегральной схеме. Представители компании утверждают, что он способен обрабатывать изображения в 170 раз быстрее, чем сопоставимые на основе GPU.

Alibaba также применяет AI для Youku – своего видеохостинга. Алгоритмы машинного обучения автоматически генерируют эскизы для 200 тыс. видео. AI может ориентироваться на определенные сегменты аудитории. Например, пользователи женского пола могут видеть одно изображение предварительного просмотра, а мужчины – другое. 

Alibaba планирует потратить 15 млрд долларов на исследования и разработки в области искусственного интеллекта к 2020 году.


Автор:
Сергей Кравченко Обозреватель


Использует ли ваша компания чат-боты для работы с клиентами?


Да (12.5%, 2 голосов)
12.5%
Нет, но собираемся (12.5%, 2 голосов)
12.5%
Нет, нам это не нужно (75%, 12 голосов)
75%

В избранное Подписаться на ответы Сортировка: Древо развёрнутое
Свернуть все
В этой теме еще нет сообщений.
Оставьте свое сообщение

См. также

Создан новый язык программирования Armada для работы с параллельными вычислениями

Новость ИТ-новость Языки программирования

Группа исследователей опубликовала новый язык программирования Armada. Язык предназначен для формальной проверки высокопроизводительных параллельных программ.

вчера в 13:55    249    SKravchenko    0       

Энтузиаст запустил в Minecraft компьютер на Windows 95

Новость ОС Windows Видеоигры ИТ-новость

Разработчик delta2force представил мод VM Computers для популярной игры-песочницы Minecraft. Он позволяет добавить в игру виртуальный компьютер и запустить на нем Windows 95.

вчера в 11:45    246    user1015646    0       

Выпущен ПК весом 83 грамма с поддержкой нескольких десктопных ОС

Новость Гаджеты ИТ-новость Микроэлектроника

Компания XCY выпустила миниатюрный компьютер Mini PC Stick, по размеру напоминающий флешку, помещающуюся в ладони. В качестве ОС на него можно установить Windows 10 или Linux.

11.08.2020    575    user-programmist    10       

Сбербанк создаст криптовалюту, привязанную к рублю

Новость Банки Блокчейн ИТ-новость Новости компаний

Сбербанк выпустит собственную криптовалюту Sbercoin – стейблкоин, курс которого будет привязан к рублю. Он упростит внутренние транзакции и не противоречит закону о цифровых финансовых активах (ЦФА).

11.08.2020    377    user1015646    5       

Windows 10 сможет запускать приложения с Android-смартфонов

Новость Windows Android Infostart Software Partners Маркет Новости компаний

5 августа 2020 года Microsoft объявила о новшествах, которые появятся в Insider Preview Build 20185. Одной из самых интересных функций стало дальнейшее развитие службы «Ваш телефон».

07.08.2020    790    capitan    4       

Программист из Slack превратил MacOS 8 в кроссплатформенное приложение

Новость ОС Mac OS ИТ-новость

Разработчик создал приложение, позволяющее запустить MacOS 8 на современных компьютерах как обычное приложение. Для этого не понадобится даже предварительно устанавливать эмулятор.

06.08.2020    708    VKuser24342747    0       

МТС получил первую в России лицензию на развитие сети 5G

Новость ИТ-новость Новости компаний Телекоммуникации

Роскомнадзор предоставил МТС лицензию на строительство сети 5G по всей территории России — в 83 из 85 субъектов. Срок действия лицензии - до лета 2025 года. Для развития сети были выданы частоты от 24,25 до 24,65 ГГц.

05.08.2020    698    user-programmist    1       

Работа с большими данными во всем мире должна регулироваться профстандартом

Новость Искусственный интеллект ИТ-новость

Британское компьютерное общество (BCS) вместе с Королевским статистическим обществом (RSS) и Королевской инженерной академией (RAEng) начали работу по созданию профстандартов в отрасли больших данных (BigData).

05.08.2020    579    SKravchenko    3       

GitHub представил дорожную карту развития сервиса

Новость GitHub ИТ-новость

GitHub будет лучше знакомить разработчиков с грядущими обновлениями сервиса при помощи публичных дорожных карт. Пользователи смогут влиять на выполнение запланированных улучшений и помогать им продвигаться вперед по карте.

05.08.2020    583    VKuser24342747    0       

IEEE опубликовал свежий рейтинг языков программирования

Новость ИТ-новость Языки программирования

Институт инженеров электротехники и электроники IEEE Spectrum недавно опубликовал свой рейтинг языков программирования за 2020 год. Как и в последние несколько лет Python снова лидирует, но есть и несколько сюрпризов.

04.08.2020    801    SKravchenko    1       

Facebook запускает конкурента Zoom

Новость ИТ-новость Мессенджеры Новости компаний

23 июля Facebook объявил, что расширяет возможности Messenger Rooms и Facebook Live, – теперь пользователи могут организовывать онлайн-совещания с участием до 50 человек.

03.08.2020    620    SKravchenko    0       

Виртуальные фанаты заполнят пустые стадионы

Новость Искусственный интеллект ИТ-новость Телекоммуникации

Из-за пандемии COVID-19 сто двадцатый сезон в истории главной лиги бейсбола США пройдет с пустыми стадионами. Но Fox Sports для своих трансляций будет заполнять трибуны виртуальными фанатами с цифровой визуализацией.

31.07.2020    672    SKravchenko    2       

Начался выпуск российских материнских плат для ARM-процессоров «Байкал»

Новость Импортозамещение ИТ-новость Микроэлектроника

Первую российскую материнскую плату для нового ARM-процессора Baikal-M представили компании «Байкал электроникс», «Эдельвейс» и «Базальт СПО». Ориентировочная стоимость платы – 50 тыс. рублей.

30.07.2020    788    user1015646    3       

Банки оценили переход на отечественное ПО в сотни миллиардов рублей

Новость Банки ИТ-новость Цифровая экономика

Российские банки пересчитали планируемые расходы на внедрение отечественных программ. Затраты финансовых учреждений могут составить до 150 млрд рублей.

30.07.2020    573    VKuser24342747    0       

Молодые сотрудники используют больше разных приложений для работы

Новость Автоматизация Аналитика ИТ-новость

Исследование, проведенное консалтинговой фирмой Creative Strategies по изучению сотрудничества, показало значительные различия в стиле и подходе к работе у разных возрастных групп.

29.07.2020    864    SKravchenko    0       

Microsoft представила утилиту для мониторинга процессов в Linux

Новость Linux ИТ-новость Новости компаний

Компания Microsoft выпустила утилиту ProcMon (Process Monitor) для Linux. Программное обеспечение распространяется под открытой лицензией MIT. Ранее ProcMon была доступна только для Windows.

29.07.2020    747    user1015646    2       

Google сделает Android Go обязательной на устройствах с ОЗУ меньше 2 ГБ

Новость Google ИТ-новость Мобильные приложения

С октября 2020 года на все новые Android-устройства, имеющие объем ОЗУ 2 ГБ и менее, Google заставит устанавливать Android Go – модифицированную версию Android для устройств начального уровня.

28.07.2020    1649    SKravchenko    0       

Google Cloud представил новые средства безопасности

Новость Google Безопасность ИТ-новость

Облачная платформа Google Cloud разработала новые инструменты для обеспечения безопасности. Они ориентированы на крупные коммерческие компании, банки и государственные учреждения.

28.07.2020    723    user1015646    0       

ПК на Windows могут перейти на ARM-процессоры

Новость Windows Mac OS ИТ-новость Микроэлектроника

22 июня Apple объявила о переходе Mac на процессоры собственного производства на базе архитектуры ARM. Первые системы появятся к концу года, начав двухлетний переходный период.

24.07.2020    1911    SKravchenko    1       

Разработчики GitHub представили GCM Core – инструмент универсальной аутентификации для Git-серверов

Новость GitHub ИТ-новость

Git Credential Manager Core – это кроссплатформенный инструмент, который может стать альтернативой традиционной HTTPS- или SSH-аутентификации для Git-серверов. Планируется, что в будущем он заменит существующие утилиты аутентификации для Windows, macOS и Linux.

24.07.2020    1162    user1015646    1       

Google выпустила большое обновление Chrome

Новость Google Безопасность Интернет Интерфейсы ИТ-новость

14 июля Google выпустила стабильную версию браузера Chrome 84 Desktop для Windows, Mac и Linux. Новый Chrome получил поддержку Web OTP API, ярлыки PWA и умеет блокировать навязчивые уведомления.

23.07.2020    1789    SKravchenko    0       

GitHub разместил пленочный архив открытого кода в арктическом хранилище

Новость GitHub ИТ-новость

GitHub завершил масштабный перенос архива открытого исходного кода в хранилище Arctic World Archive. Данные будут храниться в виде фотоснимков на пленочных накопителях.

22.07.2020    1140    VKuser24342747    2       

Денег нет: «Сколково» прекратило выдавать некоторые гранты до 2021 года

Новость ИТ-новость Минфин Стартапы Цифровая экономика

Фонд «Сколково» приостановил выдачу грантов за деньги Минфина. Высокотехнологичные компании смогут претендовать на финансирование только в следующем году.

21.07.2020    1257    VKuser24342747    1       

Docker и Amazon Web Services провели взаимную интеграцию инструментов разработчика

Новость Интеграция ИТ-новость Новости компаний

Docker и Amazon вышли на новый этап партнерства. Компании завершили двустороннюю интеграцию инструментов разработчика: Elastic Container Service (ECS) и ECS on AWS Fargate A293; со стороны Amazon; Compose и Desktop developer – со стороны Docker.

20.07.2020    1042    user1015646    0       

Министерство связи запустит единую платформу «Гостех» до конца 2021 года

Новость Законодательство ИТ-новость Минкомсвязь

Минкомсвязь определила правила проведения эксперимента по созданию единой цифровой платформы «Гостех». Поставщик и оператор системы до сих пор не назван.

17.07.2020    1185    VKuser24342747    0