Пользователям сервиса 1С:Распознавание речи доступно распознавание речи нескольких собеседников.
Рассказываем, в каких случаях может пригодиться эта возможность, и как подключить разделение по спикерам в сервисе.
Как работает разделение по спикерам в сервисе 1С:Распознавание речи
Фирма «1С» сообщила о новых возможностях в сервисе 1С:Распознавание речи – пользователи могут получить расшифровку аудиофайла с делением её на собеседников.
«В результате преобразования аудиозаписи, в которой есть одновременная речь нескольких человек, пользователь получит текст с результатами распознавания отдельно по каждому из спикеров» – говорится в описании.
Так может выглядеть расшифровка записи в виде диалога: для каждой реплики указана метка времени от начала разговора, а если на нее нажать, можно прослушать соответствующий фрагмент аудиозаписи. Источник: speech.1c.ai
Распознавания разных собеседников можно добиться в трех случаях:
- при загрузке многоканального файла с записями звуковых дорожек для каждого спикера;
- при одновременном добавлении на распознавание нескольких аудиофайлов с голосами разных участников одного совещания и автоматическом объединении их в один многоканальный файл в самом сервисе;
- при загрузке одноканальной записи – в этом случае нужно будет использовать модель «Экспериментальная с разделением по спикерам», которая автоматически разделит речь разных собеседников на отдельные текстовые блоки, при этом качество разделения на спикеров может быть ниже, чем для многоканального файла.
В каких случаях может пригодиться использование разделения по спикерам при распознавании речи
Функция разделения по спикерам может быть полезна при получении транскрибации разговоров при проведении собеседований, опросов пользователей и совещаний.
Текстовые материалы позволяют более качественно проводить поиск, выделять и делиться нужной информацией в более компактном и удобном для восприятия формате.
Стоимость секунды распознавания отличается для потокового и файлового распознавания – секунда потокового распознавания стоит столько же, сколько 4 секунды распознавания аудиофайла. Доступные тарифы сервиса 1С:Распознавание речи представлены в таблице:
| Тарифы | Цена, руб., НДС не облагается | Потоковое распознавание, коп./сек. | Файловое распознавание, коп./сек. | 
|---|---|---|---|
| 1С:Распознавание речи – 0,1 млн единиц | 1000 | 1,0 | 0,25 | 
| 1С:Распознавание речи – 1 млн единиц | 9000 | 0,9 | 0,225 | 
| 1С:Распознавание речи – 10 млн единиц | 80 000 | 0,8 | 0,2 | 
| 1С:Распознавание речи – 50 млн единиц | 350 000 | 0,7 | 0,175 | 
При наличии действующей подписки ИТС можно подключить бесплатный тестовый пакет сервиса 1С:Распознавание речи на 3600 единиц. Это примерно 1 час потокового аудио или 4 часа файлового аудио. Тестовый тариф доступен в течение 1 года с момента активации, предоставляется однократно.
| Узнать подробнее о сервисе 1С:Распознавание речи и подключить бесплатный тестовый период. 
 | 
 
							
 
								 
													 
													 
													 
													 
													 
													 
													