До старта конференции

Конвертация аудиозаписи в текст (Yandex Speech Kit)

Обработки - Универсальные обработки

Обработка для распознавания текста из аудиозаписи разговора (на базе сервиса Yandex SpeechKit Cloud). Может применяться для различных задач, где необходимо из аудиозаписи получать текст разговора: контроль менеджеров по продажам, контроль операторов колл-центров, расшифровка записей интервью и т.д.

Отдел продаж очень важное звено для любой коммерческой компании. От его работы во многом зависит успешное разватие предприятия. Поэтому для руководителей и собственников бизнеса всегда актуальна задача контроля менеджеров отдела продаж. В рамках проекта по комплексному решению такой задачи (для интернет-магазина, на базе 1С:Управление торговлей 11 + CRM) были разработаны несколько интересных решений, одно из которых - автоматическое распознавание записи телефонных разговоров менеджеров с клиентами и добавление его расшифровки в карточку телефонного звонка в 1С в виде обычного текста.

Попробовать работу системы в демо-базе можно здесь.

Основные характеристики обработки:

  1. Обработка работает на любой конфигурации на платформах 8.2 или 8.3 и подключается к базе как внешняя обработка (не требуется изменение конфигурации)
  2. Обработка написана на управляемых формах
  3. Для распознавания аудизаписи используется сервис "Yandex SpeechKit Cloud"
  4. Обработка может распознавать файлы в формате WAV (сервис Yandex SpeechKit Cloud может так же обрабатывать файлы в формате MP3, но для этого потребуется доработка обработки)
  5. Длина файла может быть любой (у сервиса Yandex SpeechKit Cloud есть ограничение на максимальную длину файла в 1  Мбайт, поэтому в обработку встроен механизм по "нарезки" файла на фрагменты нужной длины и поочередное их распознавание)
  6. С условиями использования сервиса Yandex SpeechKit Cloud можно/нужно ознакомиться здесь

Варианты использования обработки:

  1. Ручной режим - Обработка подключается к базе как внешняя обработка. Пользователь выбирает вручную файл, который требуется распознать, нажимает на кнопку Преобразовать и в соответствующем окне появляется распознанный текст из аудиозаписи. Этот текст пользователь может использовать по своему усмотрению (сохранить, прикрепить к карточке клиента и т.д.). Данный режим не зависит от конфигурации базы 1С, в которой запускается обработка (т.е. работает в любой базе 1С).
  2. Автоматический режим - Обработка запускается автоматически, ищет в базе 1С все телефонные звонки, которые еще не распознаны, и поочередно распознает их. Данный режим в типовом виде может использоваться только в конфигурации 1С:Управление торговлей 11, в которой настроена интеграция с IP телефонией (но легко может быть адаптирован для других конфигураций)
  3. "Донорский" режим - В обработке реализован механизм взаимодействия между 1С и сервисом Yandex SpeechKit Cloud. Распознавание аудиозаписей может пригодиться для множества других бизнес-процессов компаний. Поэтому наше решение может быть использовано в качестве "отправной" точки в построении каких либо других решений (код обработки полностью открыт)

Технические детали:

  1. Для "нарезки" файла на фрагменты нужной длины используется внешняя dll, которую нужно зарегистрировать в системе для использования обработки. 
  2. В типовом варианте практически весь процесс работы обработки выполняется на Клиенте.  Такая архитектура была выбрана по нескольким причинам: 1 - в клиент-серверном варианте нельзя "на сервере" подключить внешнюю dll (ограничение платформы 1С), поэтому приходится выполнять обработку "на клиенте". 2 - В компаниях часто сервер 1С и сервер IP телефонии находятся в разных местах (и с сервера 1С нет прямого доступа к серверу IP телефонии). Поэтому обработку нужно запускать на той машине, с которой физически видны файлы записей телефонных разговоров. Для этогов нашем случае используется простой bat файл, который средствами регламентных заданией windows запускает обработку в 1С по нужному расписанию.

Часто задаваемые вопросы:

  1. Если Клиенту необходим функционал, которого нет в исходной версии обработки, то мы готовы это сделать по запросу. Стоимость доработок зависит от количества изменений, которые потребуется внести в подсистему и определяется вначале при составлении Технического задания на доработку.
  2. В течении 6 мес. обновления обработки будут высылаться по запросу бесплатно. Далее подписка на год на обновления будет стоить 50% от стоимости решения.
  3. Техподдержка бесплатна на протяжении 1 месяца с момента покупки. Запросы клиента будут обрабатываться в текущем режиме в рабочие дни, но не более 1х суток после поступления запроса. Далее техподдержка осуществляется на платной основе по ставке 2000 руб./час.

Возможно Вас так же заинтересуют наши другие разработки:

Причины купить

Попробуйте Демо-версию обработки прямо сейчас в режиме онлайн.

Достоинства

Готовый инструмент для распознавания аудизаписей и перевода их в текстовой формат

Открытость кода и возможность создавать собственные решения по распознаванию аудиозаписей

Встроенная DLL по "нарезки" файлов под нужный размер

Гарантия возврата денег

Гарантия возврата денег

ООО "Инфостарт" гарантирует Вам 100% возврат оплаты, если программа не соответствует заявленному функционалу из описания. Деньги можно вернуть в полном объеме, если вы заявите об этом течение 14-ти дней со дня поступления денег на наш счет.

Программа настолько проверена в работе, что мы с полной уверенностью можем дать такую гарантию. Мы хотим, чтобы все наши покупатели оставались довольны покупкой.

Для возврата оплаты просто свяжитесь с нами.

Скачать файлы

Наименование Файл Версия Размер
Конвертация аудиозаписи в текст (Yandex Speech Kit)
11.11.2016
9000 руб.

Моментальная
доставка

Конвертация аудиозаписи в текст (Yandex Speech Kit): Техническая поддержка, настройка, доработка (1 час)
07.11.2016
2000 руб.
Конвертация аудиозаписи в текст (Yandex Speech Kit): Подписка на 1 год обновлений обработки
07.11.2016
4500 руб.

См. также

PowerTools от 1 000
Комментарии
1. Федот (zzhiraf) 7 06.07.17 17:58 Сейчас в теме
Сколько файлов можно гонять через Яндекс бесплатно? Есть какие-нибудь ограничения? Не очень понятно "пользователь должен получить API-ключ" Он уже зашит в обработку или нужно заключить договор с яндексом?
2. Александр Уткин (duck) 80 06.07.17 23:13 Сейчас в теме
Добрый день!

Согласно пункту 2.7 условий использования сервиса «Yandex SpeechKit Cloud» "Суммарное количество обращений к функциям распознавания и синтеза речи ограничено 1000 запросов для одного API-Ключа в сутки". Один запрос - отправка на распознавание одного файла, размером до 1 мб.
Ключ API регистрируется без проблем на любой их аккаунт эл.почты.
В обработке предусмотрен механизм, когда указывается несколько ключей и при исчерпании лимита на одном ключе, автоматически начинает использоваться следующий по порядку.
4. Александр Уткин (duck) 80 06.07.17 23:18 Сейчас в теме
(1)
Вы можете оценить работу модуля в тестовой базе: http://demo.near-it.ru/SpeechKit/
5. Федот (zzhiraf) 7 07.07.17 09:06 Сейчас в теме
(4) Я уже оценил. Качество и скорость отличное. 100% всех слов распознаны. Для сравнения http://www.speechpro.ru/ (Voco.Professional) этот же файл распознал на 50%.
6. Федот (zzhiraf) 7 11.08.17 18:59 Сейчас в теме
Подскажи по скорости работы обработки. Сколько времени будет конвертится звуковой файл около 40 Мбайт? Сильно ли нагружается сервер при "нарезании" файла на кусочки? Можно ли запускать несколько потоков на распознавание одновременно? Можешь в демо базе увеличить размер файла, а то не очень понятна скорость обработки.
7. Александр Уткин (duck) 80 12.08.17 08:01 Сейчас в теме
(6)
Скорость работы по сути зависит только от интернет-канала и скорости обработки файлов яндексом. Сама нарезка выполняется легко и быстро без особых затрат ресурсов. Ограничение в демо базы сделано по техническим причинам. Изначальная архитектура решения подразумевала локальную работу. Для работы в веб клиенте надо заметно поковырять код, поэтому не стал это делать.
Оставьте свое сообщение