В Alibaba научили речевой алгоритм изолировать голоса в шумной толпе

07.12.2018     

Китайский конгломерат Alibaba все чаще обращает свое внимание на искусственный интеллект. На конференции NeurIPS 2018 в Монреале он представил презентацию о своих достижениях в прикладном использовании ИИ.

Искусственный интеллект и 40 разбойников

В марте 2017 года Alibaba запускает подразделение служб ИИ для здравоохранения и производства, а в сентябре подразделение Alibaba Cloud обнародовало планы создания специализированной дочерней компании и саморазвивающегося чипа вывода AI для логистики и автономного вождения. В июле 2018 стало известно, что Alibaba начал использовать ИИ при написании продающих текстов.

Имея достаточно ресурсов, компания активно развивает цифровые сервисы на базе искусственного интеллекта.

 

 

Он узнает тебя по голосу

Декан Института данных Alibaba Ронг Джин в ходе конференции NeurIPS заявил, что AI помогает решать интересные задачи. И одна из таких задач – распознавание речи в шумных местах, например, переполненное метро или перегруженный торговый центр.

Решение Alibaba – это комплекс из аппаратного и программного обеспечения: микрофонный массив с дальним полем и сложные алгоритмы глубокого обучения, которые изолируют голоса в толпе, снижая частоту ошибок.

«Лучшие» технологии распознавания речи способны достичь с помощью микрофонной матрицы 84% точности, Alibaba утверждает, что точность ее модели находится в пределах 94-95%. Комплекс уже развернут в рамках системы голосового взаимодействия в метро Шанхая, и компания ведет переговоры, чтобы использовать ее в других городах.

Применение

Голосовое взаимодействие в транспорте – не единственное направление, в котором Alibaba применяет искусственный интеллект. Используя обработку естественного языка, ИИ выполняет автоматический перевод в реальном времени в облаке, так что розничные клиенты компании в России и Малайзии могут общаться с агентами на их родных языках. Эти алгоритмы основаны на данных десятков тысяч звонков, которые центры поддержки получают каждый день с помощью интеллектуального механизма обслуживания клиентов AliMe.

 

 

AliMe, как и Google Duplex, может вести телефонный разговор и отвечать на вопросы без участия человека. Также он может автоматически извлекать текст и изображения из прилагаемого документа.

В ходе демонстрации в Монреале Ронг Джин попросил чат-бот Dian Xiaomi рассказать о рекламных акциях для конкретного Bluetooth-динамика. Бот рассказал, какие бесплатные подарки клиенты получат при покупке, и как они будут доставлены. Еще одна демонстрация представила гуманоидное воплощение чат-бота – прототип с координированными движениями глаз, губ и головы. Dian Xiaomi обслуживает почти 3,5 миллиона пользователей в день.

И глаз как у орла

Для складского учета и поиска изображений Alibaba использует масштабируемую архитектуру компьютерного зрения, чтобы обработать сотни миллионов объектов. Его алгоритм поиска облачных изображений может распознавать идентичные картинки. Приложение для управления магазином выбирает несколько элементов на полке для создания сводки и включает в себя распределение разных брендов, может обнаруживать 100 тыс. идентификаторов товарных позиций с высокой точностью.

Эти инструменты дополняют Alibaba Ali Smart Supply Chain (ASSC) – набор инструментов AI, которые помогают продавцам прогнозировать спрос на продукт, распределять ресурсы и выбирать стратегии ценообразования. Работа машинного зрения Alibaba распространяется и на спутниковые снимки. Alibaba Ali Smart Supply Chain использует данные, собранные от AutoNavi, крупнейшего поставщика карт и навигации в Китае, насчитывающего 70 млн пользователей. Его системы могут идентифицировать недавно построенные здания и собирать информацию, связанную с дорожными работами и достопримечательностями.

 

 

Alibaba также использует компьютерное зрение, чтобы предотвратить кражи в магазинах. Алгоритм глубокого обучения AliFPGA-X100 работает на программируемой пользователем интегральной схеме. Представители компании утверждают, что он способен обрабатывать изображения в 170 раз быстрее, чем сопоставимые на основе GPU.

Alibaba также применяет AI для Youku – своего видеохостинга. Алгоритмы машинного обучения автоматически генерируют эскизы для 200 тыс. видео. AI может ориентироваться на определенные сегменты аудитории. Например, пользователи женского пола могут видеть одно изображение предварительного просмотра, а мужчины – другое. 

Alibaba планирует потратить 15 млрд долларов на исследования и разработки в области искусственного интеллекта к 2020 году.


Автор:
Сергей Кравченко Обозреватель


Использует ли ваша компания чат-боты для работы с клиентами?


Да (12.5%, 2 голосов)
12.5%
Нет, но собираемся (12.5%, 2 голосов)
12.5%
Нет, нам это не нужно (75%, 12 голосов)
75%

В избранное Подписаться на ответы Сортировка: Древо развёрнутое
Свернуть все
В этой теме еще нет сообщений.
Оставьте свое сообщение

См. также

ARM разработала гибкий пластиковый микропроцессор

Новость ИТ-новость Микроэлектроника

Специалисты ARM представили пластиковую версию процессора Cortex-M0. Решение с тонкопленочными транзисторами на полиамидной подложке унаследовало все возможности популярного микроконтроллера.

сегодня в 14:42    2456    user1015646    0       

Intel признает, что отстает от конкурентов на четыре года и будет выпускать чипы для Qualcomm

Новость ИТ-новость Микроэлектроника Новости компаний

Представители корпорации Intel заявили, что компания начнет производство чипов Qualcomm. Также компания подготовила план развития, чтобы догнать своих конкурентов, таких как Taiwan Semiconductor Manufacturing и Samsung Electronics, к 2025 году.

30.07.2021    1159    SKravchenko    1       

Представлено водяное охлаждение для чипов мощностью 2,6 кВт

Новость ИТ-новость Микроэлектроника

Компания TSMC, один из крупнейших производителей микропроцессоров, разработала инновационную систему водяного охлаждения. Она позволяет отвести от чипа 2,6 кВт тепла.

30.07.2021    1676    user1015646    1       

«Сбер» впервые в России получил патент на программу, написанную ИИ

Новость Искусственный интеллект ИТ-новость

Подразделение Sber AI зарегистрировало в Роспатенте приложение, написанное предварительно обученной нейросетью. Искусственный интеллект сгенерировал код на C++ и Java.

30.07.2021    985    VKuser24342747    3       

Линус Торвальдс добавит в Linux драйвер для NTFS от российских разработчиков

Новость Linux ИТ-новость

Создатель Linux заявил о готовности добавить драйвер в ядро операционной системы, если программисты из России займутся его интеграцией и сопровождением. Торвальдс лично примет этот pull-запрос.

28.07.2021    2103    VKuser24342747    0       

Amazon представил игровой движок с открытым исходным кодом

Новость ИТ-новость Новости компаний

Компания Amazon всерьез намерена покорить все цифровые рынки – в том числе индустрию гейминга. Разработчики выпустили движок Open 3D Engine для создания игр и других приложений с открытым исходным кодом.

28.07.2021    857    user1015646    0       

Microsoft представила эмулятор Altair 8800 на Azure Sphere

Новость ИТ-новость Микроэлектроника

Microsoft представила эмулятор ретрокомпьютера Altair 8800 на операционной системе для работы с облаком Azure Sphere.

27.07.2021    1735    SKravchenko    0       

Microsoft выпустит облачную ОС

Новость ОС ИТ-новость Облачные технологии

Компания Microsoft активно конкурирует с Amazon и Google на рынке передовых облачных технологий. Чтобы предоставить пользователям возможность гибридной работы в Windows с любого устройства, разработчики анонсировали облачную ОС – сервис Windows 365.

26.07.2021    1909    user1015646    0       

Google добавит в Chrome режим приоритетной загрузки сайта по HTTPS

Новость Безопасность Интернет ИТ-новость

В новой версии Google Chrome появится режим HTTPS-First, который заставит браузер всегда пытаться загружать сайты по защищенному протоколу. В будущих релизах веб-обозревателя эта функция будет включена по умолчанию.

21.07.2021    1264    VKuser24342747    0       

JetBrains назвала JavaScript и SQL самыми популярными языками в России

Новость Аналитика ИТ-новость Языки программирования

Компания JetBrains провела ежегодный опрос об экосистеме разработки в 2021 году. В нем приняли участие 31 743 разработчика из 183 стран, в том числе из Российской Федерации и СНГ.

21.07.2021    1436    VKuser24342747    3       

MongoDB с последней версией Atlas стал бессерверным

Новость СУБД ИТ-новость

13 июля MongoDB представила версию 5.0 платформы баз данных NoSQL. Последние обновления поддерживают многие рабочие нагрузки в бессерверном режиме. Новая версия включает новые возможности для приложений и улучшения конфиденциальности и безопасности.

20.07.2021    1729    SKravchenko    1       

«Яндекс» представил уникальный сервис для автоматического перевода видео

Новость Искусственный интеллект ИТ-новость Новости компаний Яндекс

«Яндекс» разработал прототип сервиса на базе нейросети, который в режиме реального времени переводит иностранные ролики на русский язык и озвучивает их. По словам компании, технология не имеет аналогов в мире.

20.07.2021    1658    VKuser24342747    2       

Появился способ игнорировать запрет установки Windows 11 на слабые ПК

Новость Windows ИТ-новость

Новая Windows 11 не может быть установлена на компьютеры, которые не соответствуют системным требованиям, определенным разработчиками. Однако продвинутые пользователи нашли способ обойти это ограничение.

19.07.2021    1510    VKuser24342747    0       

На свежих процессорах Intel создали микрокомпьютер под Windows 10

Новость Windows Гаджеты ИТ-новость Микроэлектроника

Энтузиасты и стартаперы полюбили Arduino и Raspberry Pi. Но инженеры Commate Computer (Commell) пошли дальше и представили миниатюрный ПК LE-37O на базе новейших чипов Intel Tiger Lake. И на нем можно запустить Windows 10.

16.07.2021    1409    user1015646    3       

Вот это поворот: Microsoft выпустила дистрибутив Linux

Новость Linux ИТ-новость Новости компаний

Пока мир замер в ожидании новой Windows 11, Microsoft решила преподнести пользователям большой сюрприз – и представила собственный дистрибутив Linux, CBL-Mariner 1.0.

15.07.2021    1827    user1015646    2       

Стартовала программа возмещения затрат разработчикам на скидки для малого бизнеса

Новость Законодательство Импортозамещение ИТ-новость Облачные технологии

Утверждена программа, в которой предусмотрено субсидирование разработки облачного программного обеспечения для малого и среднего бизнеса, а также скидки на софт, разработанный в рамках данной программы, до 50%.

15.07.2021    880    ЕленаЧерепнева    0       

Исследователи установили: ИИ-программы для собеседований не понимают речь соискателя

Новость Искусственный интеллект ИТ-новость

Эксперты из Массачусетского технологического института (MIT) изучили приложения, анализирующие резюме кандидатов. Ученые пришли к выводу, что такой софт плохо справляется с задачами и дает неверные результаты.

14.07.2021    815    VKuser24342747    1       

Юбилейный индекс TIOBE на июль. Рейтинг отмечает 20-летие

Новость ИТ-новость Рейтинг Языки программирования

Ежемесячный индекс TIOBE показывает, какие языки программирования наиболее популярны, и как их популярность растет с течением времени. В июле TIOBE отмечает 20-летие, публикует новый рейтинг и график популярности языков программирования за 20 лет.

12.07.2021    1277    SKravchenko    0       

Google сделает обязательной двухэтапную аутентификацию для аккаунтов разработчиков

Новость Google ИТ-новость Мобильные приложения

До конца года всем разработчикам мобильных приложений для продуктов Google нужно подключить двухэтапную аутентификацию. Также им придется пройти дополнительную верификацию личности. 

08.07.2021    1139    VKuser24342747    1       

Google установил новый обязательный формат для Android-приложений

Новость Google ИТ-новость Мобильные приложения Новости компаний

Компания Google объявила, что стандарт приложений Android App Bundle (AAB) станет обязательным в Play Store. Он заменит монолитный формат APK.

07.07.2021    1887    user1015646    0       

Токен исходного кода интернета продали с аукциона

Новость ИТ-новость

NFT-токены – уникальные двойники цифровых произведений – становятся все популярнее: их стали предлагать на традиционных аукционах с вековой историей. На этот раз ушел с молотка токен исходного кода интернета – на Sotheby’s его продали за 5,43 млн долларов США.

06.07.2021    2434    user1015646    0       

Российский разработчик научил нейросеть генерировать голос Геральта из The Witcher 3

Новость Видеоигры Искусственный интеллект ИТ-новость

Программист под ником nikich340 создал модификацию A Night to Remember для игры The Witcher 3: Wild Hunt, в которую добавлены новые реплики главного героя, озвученные нейросетью. 

06.07.2021    1626    VKuser24342747    0       

Linux получил крупнейшее обновление с момента выпуска пятой версии

Новость Linux ИТ-новость

Представлен первый стабильный релиз ядра Linux 5.13. По словам Линуса Торвальдса, это один из самых значительных релизов 5.x. ОС получила возможность корректно работать на процессорах Apple M1 и Intel Alder Lake.

05.07.2021    1778    VKuser24342747    4       

Amazon запустил конкурс на поиск уязвимостей AWS BugBust

Новость Безопасность ИТ-новость

Компания Amazon объявила о новом челлендже по поиску уязвимостей в AWS. И это не традиционная баунти-программа: здесь куда больше геймификации и амбициозная цель – совместно избавиться от 1 миллиона багов.

05.07.2021    1832    user1015646    0       

ИИ-помощник для программистов от Microsoft сможет дописывать код

Новость Искусственный интеллект ИТ-новость

Microsoft и GitHub представили совместный проект Copilot («второй пилот») на базе технологий организации OpenAI. Ассистент способен анализировать код и предлагать варианты завершения строк в зависимости от контекста. 

05.07.2021    2051    VKuser24342747    2