Звуковое управление в 1С 8.3

16.03.21

Разработка - Разработка внешних компонент

В данной статье описано создание библиотеки для звукового управления (выполнение команд голосом) для платформы 1С 8.3. Задача была поставлена так, чтобы модуль функционировал непосредственно на клиенте 1С, осуществляя управление формами, и взаимодействовал с интерфейсом.

Звуковое управление в 1С 8.3

В данной статье описано создание библиотеки для звукового управления (выполнение команд голосом)  для платформы 1С 8.3. Задача была поставлена так, чтобы модуль функционировал непосредственно на клиенте 1С, осуществляя управление формами и взаимодействовал с интерфейсом.

Результат тестовых испытаний на примере нескольких команд:

 

 

Примененные технологии:

NAudio (open source .NET audio library) 

Google Cloud Speech-to-Text

ML.Net

 

Первая задача, которую нужно было решить - выбор API для распознавания речи. 

Вторая - разработать механизм работы с записью звука. 

Третья - как получить команду, которую потом можно будет превратить в функцию 1С и вызвать ее. 

Четвертая - как это импортировать в 1С и обеспечить работу модуля на клиенте.

 

Выбор Speech Recognition API

Казалось бы, первое решение возможно самое простое, ведь у нас есть Windows Speech Recognition, да и подавляющее количество пользователей 1С работают в клиентах под ОС от компании Майкрософт. Примеров работы довольно много, причем готовых приложений под Visual.Net - бери, пользуйся. Один минус - нет поддержки русского языка.

Альтернативы? Либо взять облачное решение или воспользоваться open source готовым решением, которое можно будет установить на клиентском компьютере. Я выбрал первый вариант, хотя у него есть и минусы - да, вам нужен доступ в Интернет для его работы. Но и у второго варианты они есть - увеличивается дистрибутив, вычислительные затраты (вычисления, связанные с распознаванием речи ложатся на клиентский компьютер), при обновлении модуля распознавания необходимо будет обновлять его, тогда как в облачных решениях эволюция библиотеки происходит без вашего участия.  Еще один минус облачных решений - они как правило платные. Но если мы возьмем модуль от Google, то плата скажем скорее символическая.

 

 

Конечно, при дальнейшей разработке этого модуля никто не мешает сделать выбор чем пользоваться предоставив выбор пользователю и сделав поддержку разных API: установить локально бесплатную библиотеку для работы с речью или пользоваться облачным сервисом за небольшую плату. 

Решение от Google требует регистрации в их сервисе, я не буду здесь описывать этот процесс, пройдя по ссылке вы  разберетесь что надо делать (вкратце - зарегистрироваться в Google, подключить Google Cloud, добавить Google Speech-To-Text API, получить ключ, прописать путь к нему в глобальных переменных системы). Да у пользователя это может вызвать легкий ступор. Но без ключа система работать не будет. Хотя это требуется сделать всего один раз.

Итак. После того как ключ установлен, мы можем работать с API. 

 

Запись и обработка звука

Здесь мы должны сделать примерно такой же механизм, которым пользуются многие владельцы Android-смартфонов, когда они  выполняют  голосовой поиск Google.

Вы нажимаете кнопку (горячую клавишу), говорите. Получаете результат. Ваша речь распознается и формируется запрос в поисковую систему. В нашем случае - выполняется команда в 1С.

Сам гугловский API не работает с записью, это API для работы с уже сформированным файлом/буфером а как вы его сформируете - ваша задача.

С решения этой задачи началась разработка библиотеки классов для 1С. То есть задача номер 4 (как это импортировать в 1С) была решена в пользу технологии COM. 

В качестве инструмента был выбран Visual.Net 2019. Язык программирования  - С#

Лучшим решением для обработки звука была признана библиотека NAudio - за простоту, понятность, наличие хорошо разобранных примеров.

 

 

В NAudio есть два ключевых класса, которые управляют записью. WaveFileWriter - класс, который собственно пишет звук, и WaveInEvent, класс, который определяет качество звука и работает с событиями. У него обработчик событий  DataAvailable - он вызывает определенную вами функцию, если получены записанные с микрофона данные. Именно здесь придется решить важную задачу: а что собственно писать для передачи в Google?

Во-первых, мы знаем старт записи - он вызывается по нажатию кнопки, но НЕ знаем когда запись нужно остановить. 

Во-вторых, следует ли писать паузы и тихую, едва разборчивую речь?

И первая и вторая проблема была решена через анализ громкости записи. Чтобы отсечь тихую речь, а также обозначить конец команды достаточно получить уровень громкости в дате, полученной по событию DataAvailable, чтобы брать из буфера, где лежит запись, только то, что нам нужно. То есть если пользователь сказал что-то, допустим “Открой оборотно-сальдовую ведомость” и замолчал, то мы отсчитаем от последнего события DataAvailable с нужным нам уровнем громкости 1 секунду и генерируем событие RecordingStopped, чтобы остановить запись.

А если пользователь говорит без остановки? Тогда введем ограничение на длину записываемой команды. Скажем, 4 секунды. И останавливаем запись по времени.

После остановки записи нам остается отправить наши данные в Google через его класс SpeechClient (метод Recognize) и ждать ответа.

 

Обработка полученной строки

Итак, мы получили распознанную строку, преобразованную в текст. Например “Открой оборотно-сальдовую ведомость”, или “ журнал документов реализаций покажи”. Как нам получить команду, то есть строковую команду “ОткрытьОСВ” или “ОткрытьЖурналРеализаций”? Ведь ту или иную команду можно сказать по разному, и порядок слов будет произвольный.  Например “открыть журнал реализаций”, “покажи расходные накладные”, или “открой список документов продаж” должно приводить к одной и той же команде: “ОткрытьЖурналРеализаций”.

Заставить пользователя выучить список регулярных выражений? Можно, а если подойти гибче и допустить множество вариантов одного и того же действия? Можно конечно сделать поиск по ключевым словам с кучей условий. Это не очень удобное решение, особенно если учесть что количество команд может быть велико. 

Здесь было принято решение воспользоваться технологиями машинного обучения, и дать возможность пользователям самими расширять варианты произношения команд.

В рамках этой статьи описать принципы работы текстового классификатора будет сложно, поэтому ограничимся очень простым объяснением. С помощью алгоритмов машинного обучения мы должны натренировать модель, которая знает наборы различных фраз и выражений, сопоставленные с определенной командой. То есть тренировочные данные будут выглядеть так, если мы говорим о команде “ЖурналРеализаций”, где слева - варианты (признаки) (X), а справа - ответы (Y).
 

журнал реализаций;ЖурналРеализаций

список реализаций;ЖурналРеализаций

журнал реализации;ЖурналРеализаций

журнал реализацией;ЖурналРеализаций

журнал расходных накладных;ЖурналРеализаций

журнал расходные накладные;ЖурналРеализаций

список продаж;ЖурналРеализаций

список документы продаж;ЖурналРеализаций

список документов продаж;ЖурналРеализаций

список расходных документов;ЖурналРеализаций

список расходных накладных;ЖурналРеализаций

расходные накладные;ЖурналРеализаций

 

А по ОСВ, скажем, так:

оборотно-сальдовая;ОборотноСальдоваяВедомость;

оборотно-сальдовую;ОборотноСальдоваяВедомость;

оборотку;ОборотноСальдоваяВедомость;

оборотка;ОборотноСальдоваяВедомость;

оборотно-сальдовая ведомость;ОборотноСальдоваяВедомость;

осв;ОборотноСальдоваяВедомость;

сальдовку;ОборотноСальдоваяВедомость;

сальдовка;ОборотноСальдоваяВедомость

бухгалтерский отчет по счетам;ОборотноСальдоваяВедомость

И т. д.

Принцип работы этой модели достаточно прост. Итак, мы получаем распознанную фразу от Google Cloud. Следующим шагом мы выбрасываем из этой фразы все ненужные нам слова, то есть те, которых нет в нашем словаре команд (список всех слов, используемых в модели). То есть из фразы “ А покажи мне, пожалуйста, ну. Ммм...эээ, ну, расходных накладных журнал, например” останется “расходных накладных журнал”.  И потом уже просим нашу модель найти наиболее подходящий ответ (команду).Так как порядок слов для нас не важен, то программа выдаст нам очевидный ответ - “ЖурналРасходныхНакладных”.

Чтобы добавить свой вариант команды или новую команду, достаточно внести в файл тренировки данных нужные строки и вызвать функцию звукового модуля для перестройки модели (с запуском 1С модель перестраивается при старте).

 

 

Сначала это было протестировано в Python,  в виду быстроты разработки, потом было переделано на ML.NET на С# и включено в библиотеку управления звуком. Это было сделано для того чтобы не перегружать библиотеку, написанную на C# питоном. (Я не поклонник IronPython).

Итак, после распознания речи наша звуковая библиотека готова передать в 1С и саму распознанную строку и команду (если она найдена).

Отдельно стоит упомянуть размышления о работе с периодами и отборами. Особенно с датами. Скажем, нам нужно сформировать ОСВ по определенному счету и за определенный период. Здесь простого решения не получится. Скажем можно сделать еще одну модель, которая будет распознавать регулярные выражения дат - “с ..по”. “ за текущий год, “ за год”,  “ за месяц” и т.д.  И уже далее осуществлять поиск периодов работая со строкой аналитически, зная какое выражение здесь указано.

Работа в 1С

После того как библиотека классов была создана в .NET и зарегистрирована в Windows,  мы можем использовать ее в 1С через технологию COM на уже клиенте. 

В 1С было реализовано исполнение несколько команд для демонстрации работы с формами и простыми отборами (по периоду, номер счета в ОСВ).

 

 

Для получения результата на клиенте запускается Обработчик Ожиданий, который проверяет результат выполнения команды.

 

 

Возвращаемое значение - строка текста и команда, если она распознана. Команде соответствовала функция в 1С. Например:

 

 

Сначала для теста была написана внешняя обработка и события обрабатывались по кнопке. Вот так это работало:

 

 

Но в реально работающей модели это неудобно. Не будем же мы заставлять пользователя каждый раз переключаться в окно голосового управления чтобы нажать кнопку.

Тогда было принято решение сделать глобальную команду через расширение и ее выполнение по комбинации горячей клавиши, что позволяет работать с модулем фоновом режиме. То есть для голосовой команды вы нажимаете комбинацию клавиш (например CTRL+W) и говорите что вы хотите от модуля:

Дальнейшая разработка

Планы по дальнейшей разработке следующие: 

Доработка механизма регулярных выражений для работы с отборами по датам.

В расширении 1С для этого модуля создать справочник шаблонов команд, что позволит разработчику добавлять новые исполнение команд без помощи конфигуратора.

Реализация многоуровневых команд со сложным отбором (запуск отчетов с отбором по полям, создание и заполнение документов).

speech recognition звуковое управление com объекты machine learning voice control. машинное обучение

См. также

Нейросети Мастера заполнения Платформа 1С v8.3 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 Платные (руб)

Расширение для заполнения описания номенклатуры с помощью модели ИИ GigaChat от Сбера. Расширение формирует продающее описание товара по его наименованию с помощью модели искусственного интеллекта. Будет полезно для владельцев интернет магазинов, каталогов товаров и продающих через маркетплейсы. Адаптировано для основных конфигураций: УТ, ЕРП, КА, УНФ.

5000 руб.

08.11.2023    1964    11    0    

20

Разработка внешних компонент Программист Платформа 1С v8.3 Конфигурации 1cv8 Платные (руб)

Внешняя компонента в виде библиотеки (.dll файл), позволяющая посылать команды и получать ответы по протоколу WebSocket из 1С. Компонента работает только на стороне "клиента".

4440 руб.

22.06.2020    17341    16    33    

21

Разработка внешних компонент Программист Платформа 1С v8.3 Конфигурации 1cv8 1С:Управление нашей фирмой 1.6 1С:Бухгалтерия 3.0 Платные (руб)

Внешняя компонента позволяет работать c TWAIN-совместимым оборудованием (сканерами, камерами) . Полностью совместима со стандартной TWAIN-компонентой из БСП и может применяться как ее замена без изменения вызовов, при этом может работать с 64-разрядной платформой, а так же имеет расширенную функциональность, например, сохранение результата непосредственно в PDF без использования сторонних утилит. Прекрасно работает на сервере, тонком клиенте и веб-клиенте (проверена работа в браузерах Google Chrome, Mozilla Firefox и Microsoft Internet Explorer).

3000 руб.

12.05.2020    27060    135    98    

87

Разработка внешних компонент Программист Платформа 1С v8.3 Конфигурации 1cv8 Платные (руб)

Внешняя компонента позволяет печатать PDF файлы непосредственно из 1С, не используя при этом сторонних программ. Прекрасно работает на сервере, тонком клиенте и веб-клиенте. Основана на проекте PDFium из состава проекта Chromium/Chrome

1500 руб.

17.09.2018    35793    110    127    

113

Мастера заполнения Нейросети Платформа 1С v8.3 Конфигурации 1cv8 1С:Управление торговлей 11 Платные (руб)

Расширение для заполнения описания товара (номенклатуры) с помощью модели ИИ ChatGPT с ключевыми словами. Расширение формирует продающее описание товара по его наименованию с помощью модели искусственного интеллекта. Будет полезно для владельцев интернет магазинов, каталогов товаров и продающих через маркетплейсы. Адаптировано для основных конфигураций: УТ, ЕРП, КА, УНФ. Прошло аудит на 1cfresh.com. Версия для автоматического заполнения

5000 руб.

13.03.2023    16981    44    49    

74

Нейросети Пользователь Платформа 1С v8.3 1С:Управление нашей фирмой 1.6 1С:Управление торговлей 11 1С:Управление нашей фирмой 3.0 Оптовая торговля, дистрибуция, логистика Россия Управленческий учет Платные (руб)

Расширение "Искусственный интеллект и нейросети в 1С: Работа с отзывами маркетплейсов" предназначено для применения искусственного интеллекта в повседневной деятельности селлеров на маркетплейсах. Среди функций - работа с отзывами, вопросами и чатами покупателей, диалог с нейросетями, генерация картинок, заполнение описаний номенклатуры и другое.

5000 руб.

03.04.2024    3618    1    0    

7

Разработка внешних компонент Программист Платформа 1С v8.3 Конфигурации 1cv8 Платные (руб)

Позволяет автоматизировать работу с картинками. С помощью компоненты можно измерять размер изображений, поворачивать их, наносить водяные знаки, конвертировать из одного формата в другой. Будет очень полезна для интернет-магазинов и всех, кому постоянно требуется работать с различными графическими форматами. Выполнена по технологии NativeAPI. Работает с форматами: jpg (jpeg), png, bmp, gif, tif

3600 руб.

02.09.2010    76594    71    255    

189

Разработка внешних компонент Телефония, SIP Программист Платформа 1С v8.3 Конфигурации 1cv8 Россия Платные (руб)

Внешняя компонента выполнена по технологии Native API для 1С 8.х, обеспечивает доступ к программным АТС Asterisk (FreePBX, Elastix) через AMI интерфейс. Через него можно управлять многими функциями Asterisk (определение номеров, перевод звонков, набор телефона и т. д.)

2400 руб.

04.05.2018    45897    118    66    

63
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. Aleksandr_prof 195 17.03.21 05:31 Сейчас в теме
А я долго не мог понять логотип и его связь с темой. Я изначально увидел силуэт человека (плечо - острый нос - ирокез). Оказалось, что нужно было смотреть не на жёлтое, а на красное.
dadel; olya1990; DrAku1a; velemir; +4 Ответить
3. velemir 83 17.03.21 07:36 Сейчас в теме
(1) Да, логотип не очень удачный.)
2. Aleksandr_prof 195 17.03.21 05:31 Сейчас в теме
Тематика - интересная, необычная. Много работы проделано как при разработке, так и при создании статьи! Автору плюс.
4. D_e_X_T_e_R 574 17.03.21 08:09 Сейчас в теме
Прикольно, спасибо.
5. informa1555 2695 17.03.21 08:21 Сейчас в теме
Приветствую! А тут нет команды активации получается? Ну типа "Ок, Google", "Алиса", "Привет BMW" и т.д. То что кнопкой запускается это ладно, а как понять что команду уже можно диктовать? У меня например говоришь фразу "Привет 1С" или что подобное, она отвечает, потом говоришь команду "Привет, 1С": простейший голосовой ассистент для 1С. UPD: с исходниками Тут понятно что программа готова прослушать команду, а у вас я по видео не понял когда этот момент наступает...

PS. "писи-софт" - это что такое?
check2; olya1990; velemir; +3 Ответить
6. velemir 83 17.03.21 08:38 Сейчас в теме
(5) Я видел вашу работу, отлично! И по comp vision ваши разработки очень вдохновляют (есть тоже идеи проектов).

Нажимаешь на кнопку (сейчас это cntr+w на клавиатуре) и говоришь, пока клавиша (хот кей) удерживается (там появляется иконка "Запись команды", то запись идет. Как на телефоне. Запись останавливается после паузы или по времени. Ключевых слов не надо.

Да можно и в режиме "Алисы" сделать со стартом помощника по кодовому слову. Для этого есть заготовки в библиотеке классов. Но это не всегда удобно (пользователь может просто говорить, например по телефону или с коллегой, а активированный голосовой помощник будет пытаться что-то делать если будет встречать фразы команд). То есть режима должно быть два. По "хот кею" и в режиме "нон стоп" пока активирован помощник.

"PS. "писи-софт" - это что такое?"

РС СОФТ - это начало нашей новой компании), которая работает на стыке 1С и других технологий, в том числе и машинного обучения.
7. informa1555 2695 17.03.21 08:41 Сейчас в теме
(6) А т.е. пока держишь нажатым - говоришь, отпустил - команда обрабатывается? Тогда да, удобно в принципе!
8. velemir 83 17.03.21 08:43 Сейчас в теме
(7) нажал - говоришь, да. отпускать не обязательно, конец записи сам определится по паузе в речи. это и будет команда.
19. papami 56 17.03.21 10:44 Сейчас в теме
(8)
Это правильная логика. Держать микрофон не всегда оптимально. Особенно, если используется беспроводная гарнитура. Та же Алиса постоянно слушает и сажает батарею.
9. salexdv 2347 17.03.21 08:44 Сейчас в теме
speechkit от Яндекс не пробовали? Это, конечно, субъективно, но мне показалось, что с распознаванием русского у него чуть лучше дела обстоят. Правда и задача у меня была специфическая, нужно было целые и дробные числа распознавать.
11. informa1555 2695 17.03.21 08:47 Сейчас в теме
13. salexdv 2347 17.03.21 08:49 Сейчас в теме
(11) Всё так, но стоит он не сильно много, если не диктовать 24/7. Я за время тестирования потратил целых 70 рублей за 1,5 месяца. В итоге, правда, пришлось от него отказаться, но не из-за денег, а из-за специфики задачи.
14. velemir 83 17.03.21 08:50 Сейчас в теме
(11) Гугл тоже платный). Там лимит есть по времени. Но копейки стоит.
12. velemir 83 17.03.21 08:49 Сейчас в теме
(9) видел. но гугл отлично на русском отрабатывает, по крайне мере особых проблем не наблюдалось.

яндекс тоже можно попробовать, просто опыт работы с гугл апи у меня есть (хотя тут вообще все элементарно).

И вот еще есть open source

https://cmusphinx.github.io/
15. velemir 83 17.03.21 08:51 Сейчас в теме
(9) Яндекс не пробовал, но знаю. Еще есть cmusphinx. Он бесплатный и открытый код.
10. nestokay 62 17.03.21 08:46 Сейчас в теме
Интересная идея, спасибо.
16. salexdv 2347 17.03.21 08:59 Сейчас в теме
Если стоит задача распознавания ограниченного количества команд, можно использовать фейсбуковскую платформу wit.ai. Она бесплатная, но в настройке довольно замороченная. Плюсом её является то, что на выходе для разных команд можно получить один результат. Например, можно настроить так, что для фраз "оборотно-сальдовая ведомость" и "оборотка" на выходе будет "ОСВ". С распознаванием русского у неё, правда, встречаются косяки, но для определенных задач вполне может подойти.
17. velemir 83 17.03.21 09:02 Сейчас в теме
(16) ну у меня так и сделано, что вы можете говорить как угодно , и по натренированной модели программа подыщет то, что лучше всего подходит. хоть "сальдовка", хоть "осв", хоть "бухгалтерский отчет по счетам". причем порядок слов не имеет значение.

это может пригодится еще и в расшифровке более сложных команд в комплексе. скажем " создай документ реализцию с отбором ко контрагенту вася пупкин".
18. salexdv 2347 17.03.21 09:09 Сейчас в теме
(17) Это я понял. Просто написал, как вариант решения подобной задачи, не используя ML.NET. В wit.ai настраиваются и сами фразы и дообучение модели можно выполнить, но мне думаются, что ваше решение лучше распознает фразу "оборотно-сальдовая", всё таки фейсбуковская балалайка немного для другого, типа "Включи свет", "Сделай тише" и т.п. Кроме того она больше ориентирована на английский язык.
21. velemir 83 17.03.21 12:27 Сейчас в теме
(18) Интереснее самому обучить модель, поднять немного свои скилы по ML. Вообще думаю мы скоро увидим время когда ML придет в 1С, и вместо тем о том как "раскрасить колоночки в отчете" мы будем обсуждать программирование 1с-ботов)
25. Yashazz 4761 17.03.21 22:51 Сейчас в теме
(21) Знаете, лет 10-15 назад я мечтал примерно о том же. Но и по сей день самые горящие задачи с востребованными решениями - это "почему себестоимость кривая", "опять на остатках краснота" и, конечно, "у меня все крыжики пропали!!!"
26. velemir 83 18.03.21 09:12 Сейчас в теме
(25)В наших силах приблизить будущее и сделать работу интереснее. Тем более что AI технологии развиваются и безусловно за ними будущее.
20. user621724_Dimav1979 408 17.03.21 10:56 Сейчас в теме
22. hiduk 125 17.03.21 14:06 Сейчас в теме
Это новое слово в науке и технике!
А команда "Сделать всё" поддерживается?:)
23. velemir 83 17.03.21 14:47 Сейчас в теме
(22) если хорошо вложиться в ИИ то можно сделать очень многое... но это пока размышления.
24. Yashazz 4761 17.03.21 22:49 Сейчас в теме
Забавная, но, имхо, бесполезная игрушка. Так, попробовать свои силы да поиграть в обучение ИИ. Ещё понимаю, озвучка исходящей из 1С информации, но вот автоматизировать входящий поток, тем более не данные, а управление... Крайне сомнительно.

Как мне однажды сказал шеф склада и логистики одной крупной конторы, "да мне проще пятерых тупых практикантов нанять, чем эти ваши голосовые команды делать".
27. strelec13 21 18.03.21 11:51 Сейчас в теме
(24)
"да мне проще пятерых тупых практикантов нанять, чем эти ваши голосовые команды делать"


Это сколько нужно времени, чтобы каждому из пятерых тупых практикантов каждый раз устные команды давать и при том,
после выполнения очередной устной ПРОСТОЙ команды (на сложные команды, а тем более задачи они тупо не способны),
они тупо будут ждать следующей простой устной или письменной команды :)
28. RealEscander 497 22.03.21 14:45 Сейчас в теме
Кабинет... все что-то бубнят в микрофоны... Забегает чел и на весь кабинет:
Shoutdown... Yes!
29. lunjio 67 16.04.21 14:05 Сейчас в теме
Команды - "Закрой все окна", "Закрыть все окна", "Закрой окна" будут одинаково интерпретироваться ? что-то мне подсказывает, что нет, а посему особой ценности кроме как Just for fun не вижу.
30. velemir 83 17.04.21 17:21 Сейчас в теме
(29) "Что-то" вам подсказывает неверно, потому что в данной разработке использованы и технологии машинного обучения, где на каждую команду есть много интерпретаций , которые можно пополнять. Причем в произвольном порядке слов. Так что не только "закрой окна" но и "окна закрой" - будет интерпретироваться одинаково.
31. vec435 15 29.04.21 21:42 Сейчас в теме
в принципе сказать фразу "Эска, создай документ "Отпуск" с движениями по регистру "как я провел" и по регистру "этим летом" с реквизитами "шашлыки,девочки,пиво,море" и услышать в ответ фразу "какой тип у реквизита пиво?" - не так и сложно наверно
32. DeniNikitin 40 22.10.21 16:04 Сейчас в теме
Здравствуйте!
А есть ли готовая библиотека naudio или надо самому что-то делать?
33. DeniNikitin 40 22.10.21 16:06 Сейчас в теме
Плохо что нету в виде готовой разработки с dll и примером в 1с и.т.д.
34. Global__IT 286 30.03.23 13:46 Сейчас в теме
Крутанская вещь, пробовал такую штуку сделать, но не смог.
Применение в моем случае - быстрый поиск по каталогу для менеджеров по продажам. Т.е. пока разговариваю с клиентом, осущ поиск и возможно накидывается номенклатура в счет ил коммерческое предложение
35. Global__IT 286 30.03.23 13:47 Сейчас в теме
(34) Причем можно будет добавить обучение, на предмет того, если не нашла по фразе, то манагер подсказал что это и сразу записалось в правильные ответы.
36. check2 369 15.04.23 10:04 Сейчас в теме
За идею и реализацию 5, но немного дёгтя в бочку мёда: такой сервис нативный уже есть в 23й платформе - https://speech.1c.ai/apps/#demoapp , причём преимущество 23й платформы это умение распознавать речь даже при отсутствии интернета.
UPD: Хотя нужно быть честным: Автор публиковал это в 21м году, тогда про 23ю платформу и про поддержку речевых функций в ней ничего ещё не было слышно.. Первое упоминание было в инф письме №30109 от 23.12.2022
Оставьте свое сообщение