В Alibaba научили речевой алгоритм изолировать голоса в шумной толпе

07.12.2018      30489

Китайский конгломерат Alibaba все чаще обращает свое внимание на искусственный интеллект. На конференции NeurIPS 2018 в Монреале он представил презентацию о своих достижениях в прикладном использовании ИИ.

Искусственный интеллект и 40 разбойников

В марте 2017 года Alibaba запускает подразделение служб ИИ для здравоохранения и производства, а в сентябре подразделение Alibaba Cloud обнародовало планы создания специализированной дочерней компании и саморазвивающегося чипа вывода AI для логистики и автономного вождения. В июле 2018 стало известно, что Alibaba начал использовать ИИ при написании продающих текстов.

Имея достаточно ресурсов, компания активно развивает цифровые сервисы на базе искусственного интеллекта.

 

 

Он узнает тебя по голосу

Декан Института данных Alibaba Ронг Джин в ходе конференции NeurIPS заявил, что AI помогает решать интересные задачи. И одна из таких задач – распознавание речи в шумных местах, например, переполненное метро или перегруженный торговый центр.

Решение Alibaba – это комплекс из аппаратного и программного обеспечения: микрофонный массив с дальним полем и сложные алгоритмы глубокого обучения, которые изолируют голоса в толпе, снижая частоту ошибок.

«Лучшие» технологии распознавания речи способны достичь с помощью микрофонной матрицы 84% точности, Alibaba утверждает, что точность ее модели находится в пределах 94-95%. Комплекс уже развернут в рамках системы голосового взаимодействия в метро Шанхая, и компания ведет переговоры, чтобы использовать ее в других городах.

Применение

Голосовое взаимодействие в транспорте – не единственное направление, в котором Alibaba применяет искусственный интеллект. Используя обработку естественного языка, ИИ выполняет автоматический перевод в реальном времени в облаке, так что розничные клиенты компании в России и Малайзии могут общаться с агентами на их родных языках. Эти алгоритмы основаны на данных десятков тысяч звонков, которые центры поддержки получают каждый день с помощью интеллектуального механизма обслуживания клиентов AliMe.

 

 

AliMe, как и Google Duplex, может вести телефонный разговор и отвечать на вопросы без участия человека. Также он может автоматически извлекать текст и изображения из прилагаемого документа.

В ходе демонстрации в Монреале Ронг Джин попросил чат-бот Dian Xiaomi рассказать о рекламных акциях для конкретного Bluetooth-динамика. Бот рассказал, какие бесплатные подарки клиенты получат при покупке, и как они будут доставлены. Еще одна демонстрация представила гуманоидное воплощение чат-бота – прототип с координированными движениями глаз, губ и головы. Dian Xiaomi обслуживает почти 3,5 миллиона пользователей в день.

И глаз как у орла

Для складского учета и поиска изображений Alibaba использует масштабируемую архитектуру компьютерного зрения, чтобы обработать сотни миллионов объектов. Его алгоритм поиска облачных изображений может распознавать идентичные картинки. Приложение для управления магазином выбирает несколько элементов на полке для создания сводки и включает в себя распределение разных брендов, может обнаруживать 100 тыс. идентификаторов товарных позиций с высокой точностью.

Эти инструменты дополняют Alibaba Ali Smart Supply Chain (ASSC) – набор инструментов AI, которые помогают продавцам прогнозировать спрос на продукт, распределять ресурсы и выбирать стратегии ценообразования. Работа машинного зрения Alibaba распространяется и на спутниковые снимки. Alibaba Ali Smart Supply Chain использует данные, собранные от AutoNavi, крупнейшего поставщика карт и навигации в Китае, насчитывающего 70 млн пользователей. Его системы могут идентифицировать недавно построенные здания и собирать информацию, связанную с дорожными работами и достопримечательностями.

 

 

Alibaba также использует компьютерное зрение, чтобы предотвратить кражи в магазинах. Алгоритм глубокого обучения AliFPGA-X100 работает на программируемой пользователем интегральной схеме. Представители компании утверждают, что он способен обрабатывать изображения в 170 раз быстрее, чем сопоставимые на основе GPU.

Alibaba также применяет AI для Youku – своего видеохостинга. Алгоритмы машинного обучения автоматически генерируют эскизы для 200 тыс. видео. AI может ориентироваться на определенные сегменты аудитории. Например, пользователи женского пола могут видеть одно изображение предварительного просмотра, а мужчины – другое. 

Alibaba планирует потратить 15 млрд долларов на исследования и разработки в области искусственного интеллекта к 2020 году.


Автор:
Обозреватель


Использует ли ваша компания чат-боты для работы с клиентами?


Да (12.5%, 2 голосов)
12.5%
Нет, но собираемся (12.5%, 2 голосов)
12.5%
Нет, нам это не нужно (75%, 12 голосов)
75%

В избранное Подписаться на ответы Сортировка: Древо развёрнутое
Свернуть все
В этой теме еще нет сообщений.
Оставьте свое сообщение

См. также

В программу подготовки спортивных программистов вошли бег и скорость печати

Новость ИТ-Новость

Пятничное: в России вступил в силу стандарт подготовки по дисциплине «спортивное программирование». В стандарт вошли требования к физическим показателям спортсменов и скорости набора текста.

16.02.2024    596    VKuser24342747    2       

1

Росстандарт утвердил протокол LoRaWAN для интернета вещей

Новость ИТ-Новость

Федеральное агентство по техническому регулированию и метрологии (Росстандарт) утвердило национальный стандарт протокола LoRaWAN RU, таким образом он получил официальный статус. Технология используется для беспроводной передачи данных между устройствами интернета вещей.

19.01.2024    389    VKuser24342747    0       

2

Новый закон откладывает на год вступление в силу изменений в порядок регистрации на сайтах

Новость Законодательство ИТ-Новость

12 декабря вступил в силу Федеральный закон, меняющий срок, к которому все владельцы сайтов должны внести изменения в порядок авторизации пользователей на сайте. Закон вводит переходный период до 1 января 2025 года.

20.12.2023    584    VKuser24342747    2       

1

Вышло крупное обновление для Android Studio

Новость Мобильные приложения ИТ-Новость

Новая версия Android Studio под номером 2023.1 получила имя Hedgehog. Появились возможности контролировать производительность приложений и управлять подключенными устройствами.

07.12.2023    684    VKuser24342747    2       

3

GitHub опубликовал результаты ежегодного исследования проектов с открытым исходным кодом

Новость GitHub ИТ-Новость

GitHub собрал данные об Open Source проектах в рамках ежегодного исследования Octoverse. Компания изучила географию репозиториев, используемые языки программирования и нейросети, а также активность сообщества.

15.11.2023    466    VKuser24342747    1       

2

Некоммерческие проекты смогут получить бесплатный доступ к GigaChat API

Новость ИТ-компания ИТ-Новость

Компания «Сбер» заявила, что будет бесплатно предоставлять доступ к API нейросети для генерации текста GigaChat для некоммерческих проектов. Однако для них будет ограничено число доступных токенов.

01.11.2023    566    VKuser24342747    2       

3

Состоялся релиз свободной среды разработки Geany 2.0

Новость ИТ-Новость Программист

Вышла новая версия Geany 2.0. Обновление затронуло внешний вид программы, расширило поддержку файлов и сторонних проектов, добавило новые способы работы с кодом.

25.10.2023    677    VKuser24342747    0       

1

Минцифры подготовило критерии по выбору оператора реестра провайдеров хостинга

Новость Минцифры ИТ-Новость Роскомнадзор

Минцифры подготовило проект постановления, которое утверждает требования к организации, претендующей на статус оператора реестра провайдеров хостинга.

25.10.2023    338    VKuser24342747    0       

1

Минцифры составило алгоритм действий для компаний, у которых не работает VPN

Новость Минцифры ИТ-Новость

Минцифры подготовило разъяснения для российских организаций, у которых возникли перебои в работе VPN-сервисов для клиентов и сотрудников из-за блокировки запрещенных ресурсов Роскомнадзором.

24.10.2023    595    VKuser24342747    0       

0

«Сбер» объявила о доступности SberLinux OS Server для российских компаний

Новость Импортозамещение ИТ-Новость

«СберТех», дочерняя компания «Сбера», объявила о предоставлении доступа к собственной серверной операционной системе SberLinux OS Server российским компаниям. ОС включена в реестр отечественного ПО.

20.10.2023    779    VKuser24342747    0       

2

Минцифры внесло изменения в проект правил идентификации клиентов веб-хостингов

Новость Минцифры ИТ-Новость Роскомнадзор

Минцифры подготовило изменения в пакет документов, которые устанавливают новые требования для провайдеров хостинга. Ведомство расширило перечень допустимых методов идентификации клиентов.

18.10.2023    434    VKuser24342747    0       

1

Google выпустила финальную версию Android 14

Новость Android Google ИТ-Новость

Google выпустила новую версию мобильной ОС Android 14. Изменения затронули настройки внешнего вида и безопасности. Были расширены возможности камеры и инструментов для хранения данных.

12.10.2023    644    VKuser24342747    0       

1

Яндекс объявил об открытии исходного кода DataLens

Новость Аналитика ИТ-Новость Яндекс

BI-система Yandex DataLens теперь развивается в опенсорс. Код продукта выложен для всех на GitHub. Любой желающий сможет развернуть DataLens на своем железе и доработать его под свои сценарии применения.

03.10.2023    1325    ЕленаЧерепнева    1       

6

Роскомнадзор создаст реестр хостинг-провайдеров

Новость Минцифры ИТ-Новость Роскомнадзор

Минцифры подготовило несколько проектов постановлений, которые утверждают правила ведения реестра поставщиков хостинг-услуг, а также новые требования к провайдерам.

02.10.2023    536    VKuser24342747    0       

1

«СберТех» представил репозиторий GitVerse с ИИ-помощником для написания кода

Новость Импортозамещение ИТ-Новость Программист

«СберТех» начал прием заявок на тестирование веб-сервиса для публикации ИТ-проектов GitVerse. Платформа подходит для разработки программ с открытым и закрытым кодом.

26.09.2023    739    VKuser24342747    2       

1

ИП и юрлица смогут использовать смартфон для создания и замены электронной подписи

Новость ИТ-Новость ФНС Цифровая подпись

ФНС внесла изменения в правила оформления электронной подписи руководителя организации и ИП. Станет возможным продлевать ее и записывать при помощи мобильного устройства.

18.09.2023    396    VKuser24342747    1       

1

Журнал IEEE Spectrum опубликовал рейтинг популярности языков программирования

Новость ИТ-Новость Языки программирования

Журнал Института инженеров электротехники и электроники IEEE Spectrum подготовил рейтинг самых популярных языков программирования в 2023 году. Статистика разделена на три категории.

01.09.2023    1230    VKuser24342747    4       

2

В бета-версии Microsoft 365 появилась поддержка языка Python для Excel

Новость ИТ-Новость Языки программирования

С помощью библиотек и средств визуализации Python можно будет манипулировать данными Excel, а затем использовать полученные результаты в формулах, диаграммах и сводных таблицах.

28.08.2023    631    VKuser24342747    0       

2

Специалисты Калифорнийского университета установили, что боты справляются с CAPTCHA лучше, чем люди

Новость ИТ-Новость

Международная группа исследователей изучила эффективность тестов CAPTCHA. Ученые пришли к выводу, что технология больше мешает людям, потому что боты научились с ней справляться.

24.08.2023    1110    VKuser24342747    23       

2

Google Chrome начнет поддерживать квантово-устойчивые алгоритмы шифрования

Новость Google Безопасность ИТ-Новость

В версии Google Chrome 116 появится поддержка алгоритмов шифрования, устойчивых к попыткам дешифрации при помощи квантовых вычислений. Технология объединяет преимущества классической и инновационной криптографии.

24.08.2023    449    VKuser24342747    0       

1

В реестр российского ПО включен первый комплекс обработки больших данных

Новость Импортозамещение Минцифры ИТ-Новость Реестр ПО

Минцифры внесло в реестр отечественного ПО программно-аппаратный комплекс «Скала-Р», предназначенный для обработки больших данных. Это первый комплекс с таким функционалом, включенный в перечень.

22.08.2023    442    VKuser24342747    0       

1

Microsoft внедрила новые функции в GitHub Copilot и анонсировала Windows Copilot

Новость GitHub Искусственный интеллект

ИИ-помощник для разработчиков GitHub Copilot теперь не только в реальном времени анализирует код, предлагает варианты для его улучшения и помогает найти решение проблем в разработке, но и  показывает ссылки на репозитории, из которых взят код. 

17.08.2023    1122    VKuser24342747    0       

1

В JetBrains разработали ИИ-помощника для аналитиков данных

Новость Аналитика Искусственный интеллект

JetBrains представила нейросеть Ask AI для онлайн-блокнота Datalore. Виртуальный ассистент способен генерировать код на нескольких языках, предлагать доработки и упрощать процесс аналитики данных. 

16.08.2023    624    VKuser24342747    0       

1

Исследование: ChatGPT дает неправильный ответ на половину вопросов о программировании

Новость Искусственный интеллект ИТ-Новость

Чат-бот OpenAI ошибается в 52% случаев, когда отвечает на вопросы по программированию. Однако делает это так убедительно, что пользователи не замечают ошибки. 

14.08.2023    951    VKuser24342747    5       

3

Минцифры проведет эксперимент по цифровизации «жизненного цикла» госслужащего

Новость Минцифры ИТ-Новость

Минцифры подготовило постановление о проведении эксперимента по внедрению ИТ в управление «жизненным циклом» госслужащего. Ведомство намерено автоматизировать все этапы работы сотрудников госструктур.

04.08.2023    533    VKuser24342747    0       

2