Официальный технологический блог «1С» «Заметки из Зазеркалья» анонсировал развитие сервиса 1С:Распознавание речи.
Пользователям обещают улучшенное понимание числительных, новый режим файлового распознавания и поддержку дополнительных грамматик.
Что ждать от 1С:Распознавания речи в 1С:Предприятие 8.5.3
В официальном технологическом блоге «1С» опубликована заметка об обновлениях, которые улучшат качество и удобство распознавания речи в платформе 8.5.3.
Разработчики отмечают: «Мы продолжаем улучшать технологии распознавания речи в платформе 1С:Предприятие. В новой версии будет реализован ряд изменений, которые делают работу с речью более точной, гибкой и быстрой».
В качестве ключевых нововведений заявлены:
-
Поддержка дополнительных грамматик. При файловом распознавании можно будет задавать собственные грамматики, что повысит точность распознавания терминов, имён и других специфичных выражений. Также можно будет ограничить распознавание только заданной грамматикой – например, извлекать из аудио только фамилии.
-
Новый режим файлового распознавания. Улучшены пунктуация, форматирование чисел и нагрузка на процессор. Обработка длинных записей (лекции, вебинары, звонки, совещания) ускорена более чем в два раза. Также реализован режим потоковой обработки аудиофайлов.
- Улучшенное понимание числительных с учетом контекста – от разговорных выражений до деловой документации. Позволяет точнее подбирать формат заполнения полей, что улучшает восприятие результатов:
- для порядковых числительных: «первая помощь» распознается корректно, не подменяется на «1 помощь»;
- для дробных и десятичных значений: «полтора литра» → «1,5 л» или «две целых пять десятых» → «2,5»;
- для сокращений и единиц измерения: «сто миллионов» → «100 млн», «рост сто семьдесят восемь сантиметров» → «178 см»
- для дат, телефонов, сумм, ИНН: «тридцать первое декабря 2019 года» → «31.12.2019», «телефон девятьсот девять...» → «+7(909)000-50-40» и «823 рубля 55 копеек» → «823 руб. 55 коп.»
Как можно использовать 1С:Распознавание речи уже сейчас
Продукт «1С:Распознавание речи» доступен средствами встроенного языка платформы «1С:Предприятие 8» с версии 8.3.23 и может быть встроен в любое решение 1С. Для изучения программных возможностей работы с сервисом предоставляется бесплатное демо-приложение.
Кроме этого, с версии 3.0.9.18 функциональность сервиса встроена в 1С:Документооборот КОРП – там уже сейчас можно:
- диктовать текст электронных писем и подбирать для них адресатов;
- голосом заполнять описание для задач;
- при согласовании и ознакомлении надиктовывать отчеты об исполнении, резолюции и комментарии.
Функции распознавания речи в 1С:ДО 3.0: набор текста письма и подбор адресатов голосом
На сегодняшний день сервис 1С:Распознавание речи предлагает следующие возможности:
- Потоковое распознавание – пользователь отправляет аудиоданные в режиме реального времени, в ответ периодически получает распознанный текст; это удобно при диктовке текста или при управлении интерфейсом программы.
- Файловое распознавание – пользователь отправляет на распознавание готовый аудиофайл и в ответ получает идентификатор задачи, по которому в дальнейшем сможет получить результат распознавания. В данном случае распознанный текст будет предоставлен пользователю с задержкой, которая зависит от длительности аудиофайла и текущей загрузки облачного сервиса.
- Разделение по спикерам – в результате распознавания пользователь получит текст, в котором будут отображены результаты отдельно по каждому из спикеров. Полезно при расшифровке интервью, звонков, совещаний и других диалогов.
- Поддержка русского и английского языков – в будущем планируется расширение языкового набора.
Сервис 1С:Распознавание речи можно использовать в локальном и облачном режиме:
- в локальном режиме распознавание не тарифицируется – чтобы бесплатно использовать сервис на собственном компьютере, потребуется скачать выбранную модель распознавания из облака 1С (доступно, если программа находится на официальной поддержке);
- в облачном режиме распознавания доступно несколько платных тарифов:
- 1С:Распознавание речи – 0,1 млн единиц, примерно 27 часов потокового аудио или 110 часов аудиофайлов – 1 000 руб./год
- 1С:Распознавание речи – 1 млн единиц, примерно 270 часов потокового аудио или 1100 часов аудиофайлов – 9 000 руб./год
- 1С:Распознавание речи – 10 млн единиц, примерно 2700 часов потокового аудио или 11000 часов аудиофайлов – 80 000 руб./год
- 1С:Распознавание речи – 50 млн единиц, примерно 13 500 часов потокового аудио или 55 000 часов аудиофайлов – 350 000 руб./год
Новые пользователи с активной подпиской ИТС могут бесплатно подключить тестовый пакет на 3600 единиц, позволяющий протестировать функциональность сервиса на практике, не скачивая модели на локальный компьютер. Количество доступных единиц в тарифе рассчитано на распознавание до 4 часов аудиофайлов или 1 часа потокового аудио.