Пользователям сервиса 1С:Распознавание речи доступно распознавание речи нескольких собеседников.
Рассказываем, в каких случаях может пригодиться эта возможность, и как подключить разделение по спикерам в сервисе.
Как работает разделение по спикерам в сервисе 1С:Распознавание речи
Фирма «1С» сообщила о новых возможностях в сервисе 1С:Распознавание речи – пользователи могут получить расшифровку аудиофайла с делением её на собеседников.
«В результате преобразования аудиозаписи, в которой есть одновременная речь нескольких человек, пользователь получит текст с результатами распознавания отдельно по каждому из спикеров» – говорится в описании.
Так может выглядеть расшифровка записи в виде диалога: для каждой реплики указана метка времени от начала разговора, а если на нее нажать, можно прослушать соответствующий фрагмент аудиозаписи. Источник: speech.1c.ai
Распознавания разных собеседников можно добиться в трех случаях:
- при загрузке многоканального файла с записями звуковых дорожек для каждого спикера;
- при одновременном добавлении на распознавание нескольких аудиофайлов с голосами разных участников одного совещания и автоматическом объединении их в один многоканальный файл в самом сервисе;
- при загрузке одноканальной записи – в этом случае нужно будет использовать модель «Экспериментальная с разделением по спикерам», которая автоматически разделит речь разных собеседников на отдельные текстовые блоки, при этом качество разделения на спикеров может быть ниже, чем для многоканального файла.
В каких случаях может пригодиться использование разделения по спикерам при распознавании речи
Функция разделения по спикерам может быть полезна при получении транскрибации разговоров при проведении собеседований, опросов пользователей и совещаний.
Текстовые материалы позволяют более качественно проводить поиск, выделять и делиться нужной информацией в более компактном и удобном для восприятия формате.
Стоимость секунды распознавания отличается для потокового и файлового распознавания – секунда потокового распознавания стоит столько же, сколько 4 секунды распознавания аудиофайла. Доступные тарифы сервиса 1С:Распознавание речи представлены в таблице:
Тарифы |
Цена, руб., НДС не облагается |
Потоковое распознавание, коп./сек. |
Файловое распознавание, коп./сек. |
---|---|---|---|
1С:Распознавание речи – 0,1 млн единиц |
1000 |
1,0 |
0,25 |
1С:Распознавание речи – 1 млн единиц |
9000 |
0,9 |
0,225 |
1С:Распознавание речи – 10 млн единиц |
80 000 |
0,8 |
0,2 |
1С:Распознавание речи – 50 млн единиц |
350 000 |
0,7 |
0,175 |
При наличии действующей подписки ИТС можно подключить бесплатный тестовый пакет сервиса 1С:Распознавание речи на 3600 единиц. Это примерно 1 час потокового аудио или 4 часа файлового аудио. Тестовый тариф доступен в течение 1 года с момента активации, предоставляется однократно.
Узнать подробнее о сервисе 1С:Распознавание речи и подключить бесплатный тестовый период.
|