Пользователям стал доступен продукт по автоматическому преобразованию речи в текст в приложениях 1С. Отвечаем на главные вопросы, которые возникают после прочтения этого сообщения: зачем это нужно и сколько это стоит.
Возможности нового сервиса 1С:Распознавание речи и тарифы на подключение
Фирма «1С» запустила новый сервис по распознаванию речи. Под распознаванием понимается преобразование звукового потока или звукового файла в текст.
Разработчики обозначили два варианта распознавания:
- потоковое распознавание, когда пользователь отправляет аудиоданные в режиме реального времени, а в ответ получает распознанный текст; такой вариант подходит для надиктовывания писем или управления интерфейсом программы; длительность одного сеанса при потоковом распознавании речи с помощью сервиса имеет ограничение в 2 часа, для локальной установки ограничений нет;
- файловое распознавание, когда пользователь отправляет в сервис файл с аудио, в ответ получает результат распознавания; например, распознавать можно аудиозаписи телефонных звонков, в том числе жалобы, пожелания и т.п.
Новые возможности будут доступны как облачный сервис и как локальная функциональность для решений на платформе 8.3.23 и выше. Причем в локальном варианте использования распознавание будет бесплатным.
Для локального распознавания речи потребуется скачать модели распознавания из облака 1С – при этом необходимо, чтобы программа пользователя находилась на официальной поддержке. Для дальнейшего распознавания речи локально подписка ИТС не потребуется.
В облаке сервис будет тарифицироваться по секундам и оплачиваться в соответствии с объявленными тарифами.
В целом, цена использования распознавания речи будет зависеть от длительности аудио и варианта распознавания. На сайте сервиса сказано, что распознавание потокового аудио будет обходиться дешевле 60 копеек за минуту, а распознавание аудиофайлов еще доступнее – до 15 копеек за минуту.
- Для потокового распознавания единица тарификации равна 1 секунде. А списание стоимости выполняется за каждые полные или неполные 20 секунд.
- Для распознавания звуковых файлов единица тарификации равна 4 секундам, а списание стоимости будет выполняться за каждые полные или неполные 20 секунд аудиофайла.
Тарифы |
Розничная цена (руб.) |
---|---|
1С:Распознавание речи – 0,1 млн единиц |
1000 |
1С:Распознавание речи – 1 млн единиц |
9000 |
1С:Распознавание речи – 10 млн единиц |
80 000 |
1С:Распознавание речи – 50 млн единиц |
350 000 |
Для подписчиков ИТС предусмотрен бесплатный тестовый тариф на 3600 единиц. Это примерно 1 час потокового аудио или 4 часа файлового аудио. Тестовый тарифный план доступен в течение 1 года и предоставляется только один раз.
Как можно использовать распознавание голоса в бизнес-приложениях: базовые сценарии
В информационном письме на сайте «1С», посвященном выходу нового сервиса, рассматривается несколько возможных сценариев использования трансформации звука в текст. Все их можно разделить на три группы:
- голосовое управление интерфейсом, в том числе для мобильных приложений;
- надиктовка длинных текстов;
- распознавание звуковых файлов.
В фирме «1С» считают, что преобразование звука может применяться в задачах по роботизации звонков для проведения опросов и сбора информации, в голосовых системах самообслуживания, для речевой аналитики работы с клиентами, а также при создании интерфейсов для людей с ограниченными возможностями.
Отмечается также, что распознавать можно русскую и английскую речь. В дальнейшем состав доступных языков планируется расширять.
Попробовать 1С:Распознавание речи: в демоприложении или в 1С:Документооборот 3.0.9
Сейчас попробовать новый сервис можно в демонстрационном приложении. Загрузить его можно на сайте сервиса. Там же есть подробное описание настроек, которые нужно выполнить для успешной работы с распознаванием.
Еще одна возможность ознакомиться с тем, как 1С преобразует звук в текст – это 1С:Документооборот 3.0.9.18. Релиз конфигурации уже опубликован. Пока возможность голосового ввода включена в тестовом режиме, но основную функциональность сервиса можно попробовать уже сейчас. В том числе:
- диктовать текст электронных писем и подбирать для них адресатов;
- голосом заполнять описание для задач;
- при согласовании и ознакомлении надиктовывать отчеты об исполнении, резолюции и комментарии.
Функции распознавания речи в 1С:ДО 3.0: набор текста письма и подбор адресатов голосом. Источник: speech.1c.ai
Отметим, что новый сервис может оказать существенное влияние на подсистему мероприятий в 1С:ДО, потому что возможность распознавать речь позволит анализировать содержание звуковых файлов – записей совещаний и других деловых встреч. Таким образом материалы, существующие в звуковом формате, теперь могут распознаваться, анализироваться, и, что очень важно, попадать в результаты поиска.
Вместе с системой корпоративных тегов и механизмом отображения связей документа это позволит сделать логику принятия того или иного решения более прозрачной, а значит в конечном счете повысит качество управления в организации, где используется 1С:ДО 3.0.
Информационное письмо, посвящённое выходу сервиса 1С:Распознавание речи