Управление 1С голосом

19.12.25

Интеграция - Распознавание документов и образов

Управление 1С голосом (в любой конфигурации), преобразование голоса в текст в текстовых реквизитах форм, в полях ввода с поиском по значению реквизита и т.д. и т.п.

Файлы

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование Скачано Купить файл
Управление 1С голосом
.cfe 44,98Kb
2 3 000 руб. Купить
Тест распознавания
.epf 8,68Kb
1 2 500 руб. Купить

Подписка PRO — скачивайте любые файлы со скидкой до 85% из Базы знаний

Оформите подписку на компанию для решения рабочих задач

Оформить подписку и скачать решение со скидкой

Итак, уже достаточно давно этот функционал появился на уровне платформы 1С. Не в каких то отдельных конфигурациях, а именно это новый функционал платформы. Одновременно с этим в конфигураторе появился такой инструмент, как работа с речью:

Есть уже много публикаций на форуме на эту тему, и я решил сам все прощупать и протестировать.

Итак, вот здесь дословно, как все подключить и настроить //infostart.ru/1c/tools/2402460/. И там все правильно описано и приводится пример распознавания из файла. За исключением нескольких но!!!

Во-первых, если хотите бесплатное распознавание и у вас слабый компьютер, лучше устанавливать версию 1.1.17 облегченную! В противном случае, вы словите ошибку аварийного завершения программы при не хватке памяти. И потом долго придется ловить момент, как удалить пакет. 

Во-вторых, нам интересно именно потоковое распознавание!!!

Делается это примерно так:

Функция ПоддерживаетсяПотоковоеРаспознавание() Экспорт
	Возврат РаботаСРечью.ПоддерживаетсяПотоковоеРаспознавание();
КонецФункции

Процедура НачатьПотоковоеРаспознавание(
		Ключ,
		ОбработчикРаспознавания,
		ПараметрыМодели,
		ИспользованиеВариантаРасположенияРаботыСРечью,
		ПараметрыПотоковогоРаспознавания
	) Экспорт

	РаботаСРечью.НачатьПотоковоеРаспознавание(
		Ключ,
		ОбработчикРаспознавания,
		ПараметрыМодели,
		ИспользованиеВариантаРасположенияРаботыСРечью,
		ПараметрыПотоковогоРаспознавания
	);
КонецПроцедуры

Процедура ЗапуститьУправлениеГолосом() Экспорт
Ключ = Новый УникальныйИдентификатор(); 
кткт_РаспознованиеРечи.УстановитьКлючУправления(Ключ);
ПараметрыМодели = Новый ПараметрыМоделиРаспознаванияРечи; 
ВариантИспользования = ВариантИспользованияРасположенияРаботыСРечью.ТолькоЛокальное;
ПараметрыРаспознавания = Новый ПараметрыПотоковогоРаспознаванияРечи; 
ПараметрыРаспознавания.ПолучатьВариантыПромежуточныхГипотез = Ложь;
ПараметрыРаспознавания.ПолучатьПромежуточныеРезультаты = Ложь;  
кткт_РаспознованиеРечи.УстановитьДополнительнуюГрамматикуСеанса(Ключ,1);
НачатьПотоковоеРаспознавание(
			Ключ,
			Новый ОписаниеОповещения(
				"ПриПолученииКомандыГолосом", ЭтотОбъект, Ложь,
				"ПриОбработкеОшибкиРаспознавания", ЭтотОбъект),
			ПараметрыМодели,
			ВариантИспользования,
			ПараметрыРаспознавания
		);  
Состояние("Управление голосом",,"Сервис запущен",БиблиотекаКартинок.КрасныйМикрофон);		
КонецПроцедуры  

Как вы видите, достаточно много параметров, которые вы можете менять на свое усмотрение, но результат, конечно же, обрабатывается в функции:

Процедура ПриПолученииКомандыГолосом(РезультатРаспознавания, ПродолжитьРаспознавание, Контекст) Экспорт
фраза = РезультатРаспознавания.ДанныеФраз[0].Фраза; 
фраза = Врег(стрЗаменить(фраза,".",""));  
// Далее команды из справочника
// Замена символа '.' нужна только в локальном распозновании
// Далее обработка результата полученных фраз
// Или массива фраз и выбор наиболее уверенного распознования
КонецПроцедуры	

По поводу установки Дополнительной грамматики. Это дело хорошее, но не обязательное. Это если что-то распознается не так, как нужно, можно добавить.

Так-то идея и функционал хороший, но будем ждать исполнения и применения во всех конфигурациях от разработчика.  Кому интересно, можете пощупать уже сейчас.

Напомню, если вас заинтересовала тема и вам прям это крайне необходимо, то есть платные (облачные) модели https://speech.1c.ai/prices/, все, что скачано и установлено локально, на данный момент бесплатно!!! 

Функционал расширения разрабатывался на БП 3 последнего релиза, конечно же, был протестирован на Рознице 3. Он без привязки к какой-либо конфигурации и будет работать на любой!

Проверено на следующих конфигурациях и релизах:

  • Бухгалтерия предприятия, редакция 3.0, релизы 3.0.188.22
  • Управление нашей фирмой, редакция 3.0, релизы 3.0.12.226
  • Розница, редакция 2.3, релизы 2.3.23.65
  • Розница, редакция 3.0, релизы 3.0.12.226
  • Управление торговлей, редакция 11, релизы 11.5.25.80

Вступайте в нашу телеграмм-группу Инфостарт

См. также

SALE! 30%

Распознавание документов и образов Программист Пользователь 1С:Предприятие 8 Россия Абонемент ($m)

Решение на платформе 1С для автоматической расшифровки голосовых сообщений из Telegram. Система отслеживает новые аудио в чат-боте, передает их на локальный сервер с Whisper для преобразования в текст и автоматически возвращает готовую транскрипцию обратно в чат. Должна работать на любой конфигурации 1С. Пригодится для энтузиастов и разработчиков интеграций 1С и ИИ.

1 стартмани

25.11.2025    816    2    marat987654321    2    

3

Нейросети Распознавание документов и образов Программист 1С:Предприятие 8 Россия Абонемент ($m)

Статья описывает практический подход к автоматизации сравнения документов с применением технологий OCR и локальных языковых моделей. Рассматриваются этапы настройки и интеграции Tesseract OCR, LM Studio и внешней обработки 1С для создания автономного решения.

1 стартмани

20.11.2025    2909    prokhodolya    5    

19

Учет документов Распознавание документов и образов Бухгалтер Пользователь 1С 8.3 1С:Управление торговлей 11 Платные (руб)

СканДок — это «сканер в смартфоне» для 1С. Вложение файлов в документы 1С за 30–60 секунд без очереди к сканеру и без поиска файлов по папкам.

61000 руб.

24.10.2025    1083    0    0    

0

Нейросети Распознавание документов и образов Программист Пользователь 1С:Предприятие 8 Абонемент ($m)

Автоматическое распознавание PDF-накладных через Azure Document Intelligence - мощный AI-сервис от Microsoft для извлечения данных без парсинга и конвертации. Легко адаптируется под Ваши нужды, точность до 99%.

2 стартмани

29.09.2025    1919    6    da_1c    7    

1

Распознавание документов и образов Бухгалтер Пользователь 1С:Предприятие 8 1С:Бухгалтерия государственного учреждения Государственные, бюджетные структуры Россия Бухгалтерский учет Бюджетный учет Бесплатно (free)

Расширение для автоматического распознавания первичных документов в 1С:Бухгалтерии государственного учреждения (редакция 2.0). Поддерживает сканы, фото, цифровые файлы и архивы, упрощает ввод счетов, накладных, УПД и кассовых чеков.

13.08.2025    2450    91    Natalya_Ivanova    0    

3
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. SerVer1C 998 19.12.25 12:31 Сейчас в теме
В той публикации в комментах писал, и здесь напишу, что встроенный эсный движок распознавания речи очень унылый. Юзайте другие модели и будет вам щастье.
starik-2005; +1 Ответить
3. starik-2005 3210 19.12.25 14:05 Сейчас в теме
(1)
другие
Еще бы написал, какие. Например, vosk - хорошо распознает речь. Или whisper от openAI - хорошо распознает много что, но скорее ориентирован на потоковое распознавание записей, т.к. снабжает это все пунктуацией. Есть модификации последнего для "квантованных" моделей, которые работают существенно быстрее. В русский язык они ну очень неплохо умеют.

И в идеале надо делать так: предпромпт с описанием кейсов в выводом того сценария, который больше всего подходит, или пустой вывод, если вообще сказанное со сценарием не сопоставляется. В него распознанный фрагмент, от него сценарий с параметрами (типа "дай продажи за октябрь" -> "отчет продажи", "дата начала: 2025-10-01", "дата конца: 2025-10-31", "уточнение: организация, контрагент, ..." -> "по какой конторе, контрагенту, складу" -> по всем -> ...).
4. SerVer1C 998 19.12.25 14:08 Сейчас в теме
(3) Да, vosk норм. В том комменте я писал про замеры, что он в 7 (!) раз быстрее в однопотоке и в 35 (!!) раз быстрее в многопотоке.
5. starik-2005 3210 19.12.25 14:12 Сейчас в теме
(4)
vosk норм
Пользовался много чем - купил себе 5070ti для экспериментов. Распознавание на CUDA очень даже быстрое на всем, до чего дотянулся. Генерация текста - 2,5 часа на "tts-что-то там не помню" - минута. Но там ограничение по генерации на 1000 символов, пришлось колхозить скрипт на питоне, который текст на слова разбил, а потом из слов собирал предложения до точки, пока не будет 900+ символов. После чего в генератор. В итоге 168 файлов за минуту, а может и меньше даже. Потом это все в ffmpeg и в итоге 75 метров аудиокнижка с весьма неплохим качеством (48000 Гц)
Viktor_Ermakov; SerVer1C; +2 Ответить
2. kras_71 93 19.12.25 13:38 Сейчас в теме
Достаточно хорошо все распознает, ну бывают конечно же ошибки, дополнительные грамматики в помощь.
6. mkalimulin 1617 19.12.25 15:31 Сейчас в теме
(2) WER для русского языка какой? Никакой? Вендор вам не сообщил? А как тогда пользоваться в серьезных целях?
А главное, вот вы распознали, а дальше что? Дальше вы все равно берете LLM от какого-нибудь провайдера. А у этого провайдера свое распознавание (с указанием WER для каждого языка). Ну и зачем вам два провайдера?
Про локальное использование давайте даже не будем говорить
7. kras_71 93 19.12.25 19:18 Сейчас в теме
(6)
WER для русского языка

WER я так понимаю это коэффициент ошибок на уровне слов??? Вендор не сообщил, но дает возможность вам программного выбора. Такой есть параметр в данных распознавания фраз, он называется 'Уверенность'.
 фраза = РезультатРаспознавания.ДанныеФраз[0].Фраза; 

В моем примере я беру самый первый вариант, но можно поиграться со всем массивом, применив какой ни будь генетический алгоритм, все в Ваших руках!!!
Просто если Вендор начал внедрять это все на уровне платформы, значит дальше будет лучше наверняка и какой смысл использовать сторонние сервисы для распознавания я не могу понять!!! Это и сложнее во внедрении и ни чуть не менее затратно!
8. mkalimulin 1617 19.12.25 19:24 Сейчас в теме
(7) Да играться с чем угодно можно.
А для дела нужны серьезные инструменты
9. kras_71 93 19.12.25 19:32 Сейчас в теме
(8) Ну расскажите нам о своих исследованиях, будем рады, если Вы поделитесь опытом. Я не в коем случае не отстаиваю ни чьи права, может Вы и правы и есть более продвинутые решения. Я просто поделился опытом, вот и все. Но тем не менее возникает вопрос, а оно все это надо вообще???
10. mkalimulin 1617 19.12.25 21:52 Сейчас в теме
(9) Тут речь не об исследованиях а о mainstream. Мне нравится ваша работа, я поставил вам плюс. А пишу здесь для того, чтобы сподвигнуть вас двигаться дальше
а оно все это надо вообще

Конечно, надо. Погрузитесь в тему, не пожалеете
starik-2005; +1 Ответить
11. osivv 280 20.12.25 22:32 Сейчас в теме
Спасибо, отличная работа. Хочется уточнить это полноценная замена демо конфигурации от 1С? Будет самостоятельно работать? Обязательна привязка к какой-то конфиге? С "пустой" будет работать? Или нужен какой то минимум?
Вопросы не спроста, т.к. имею две демки, пробовал обе, по большому счету мои потребности удовлетворяет. И ваша разработка работает аналогично - то это то что надо. А нужно мне это для голосового управления, т.к. нужно "безоблачное" распознавание голоса. Доработка демок 1С удовольствие сомнительное, и ваше решение как нельзя лучше подойдет.
"+", добавил в избранное.
12. starik-2005 3210 23.12.25 16:29 Сейчас в теме
(11)
нужно "безоблачное" распознавание голоса
vosk
13. osivv 280 23.12.25 16:38 Сейчас в теме
(12)
vosk

Спасибо конечно, но интересует именно на 1С.
14. starik-2005 3210 23.12.25 16:44 Сейчас в теме
(13)
но интересует именно на 1С
А что, веб-сервисы уже отменили? Что вам лично должно помешать прикрутить к 1С хоть черта лысого, чтобы задачу решить? Не умеете пользоваться дипсиком?
15. osivv 280 23.12.25 16:54 Сейчас в теме
(14) Что-то как-то вы неуважительно беседу ведёте уважаемый...
Вопросы были заданы АВТОРУ и не спроста...
Что касается ответов на ваши вопросы, всё прикручивал, и мелкософт, и гугл, и локальные сервисы и ещё много чего. И если бы мне были интересны не известные альтернативные решения, так бы об этом и спросил.
Есть такое выражение "мне так надо".
16. starik-2005 3210 23.12.25 16:59 Сейчас в теме
(15)
Что касается ответов на ваши вопросы, всё прикручивал, и мелкософт, и гугл, и локальные сервисы и ещё много чего. И если бы мне были интересны не известные альтернативные решения, так бы об этом и спросил.
Условно, в мире ИИ все меняется примерно раз в квартал, иногда что-то держится и год. 1С очень сильно отстает от передового опыта. Использовать ее решения - это быть на три шага сзади. На мобилках распознавание речи появилось ну очень давно, и даже голос с ужасным акцентом 8 лет назад распознавался прекрасно и формировал надписи без акцента. Сейчас даже на райспберри можно установить модельки, которые влезут в ее память и будут выдавать все, что было произнесено поблизости - цена вопроса 5 тыр.

Но да, выбирать тому, кто выбирает. Было бы интересно еще знать ответ на вопрос "зачем?"
17. osivv 280 23.12.25 17:26 Сейчас в теме
(16) "Это всё интересно, но ничего не понятно" - © не знаю кто.
Спасибо, стараюсь держать руку на пульсе. Когда-то надцать лет назад даже написал мобильное приложение на 1С, с распознаванием. Писал скрипты в Google Home.
(16)
Было бы интересно еще знать ответ на вопрос "зачем?"

Ну если прям так интересно: дома порядка 40 IoT устройств, почти все облачные. В связи с работой нашего "всемогущего и вездесущего" частенько девайсы отваливаются, скрипты не работают, и самое плохое - часто в самый неподходящий момент. Это уже начало надоедать.
Так вот, решил по-маленьку их отвязывать, и переводить на локальную работу.
Можно конечно малинку, ХА и прочее...
Не хочу, на игрался, подобного барахла - куча в кладовке.
Как говорится, "если хочешь чтобы работало хорошо, сделай сам".
18. starik-2005 3210 23.12.25 18:20 Сейчас в теме
(17)
сделай сам
https://www.ozon.ru/category/grokaem-mashinnoe-obuchenie/

Я под "сделай сам" предполагаю уровень хотя бы torch или tenzorflow, но не "платформа 1С".
19. kras_71 93 25.12.25 16:13 Сейчас в теме
(11)
Будет самостоятельно работать?

Да, это самостоятельное расширение. Будет работать на любой конфигурации включая самописные.
Или нужен какой то минимум?

Нет не нужен. Работа с речью реализована на уровне платформы.
Хочется уточнить это полноценная замена демо конфигурации от 1С

Не сравнивал, но на вскидку в демо конфигурациях есть еще синтез речи возможно, но нет именно управления голосом.
20. osivv 280 25.12.25 16:18 Сейчас в теме
(19)
Да, это самостоятельное расширение. Будет работать на любой конфигурации включая самописные.

Спасибо за ответ.
Правильно понимаю, ни БСП, ни какие либо иные штатные/типовые процедуры и функции, ни иное не надо, можно смело подключать к "пустой"?
Синтез речи можно сказать не нужен.
22. kras_71 93 25.12.25 17:13 Сейчас в теме
(20)
Синтез речи можно сказать не нужен.

Процедура Сказать(Текст)   
    VoiceMod = Новый COMОбъект("SAPI.SpVoice");
    VoiceMod.Rate = 2;
    VoiceMod.Priority = 0;
    VoiceMod.EventInterests = 0;
    VoiceMod.Volume = 70;
    VoiceMod.Voice.Category.Default = "HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech_OneCore\Voices­\Tokens\MSTTS_V110_ruRU_PavelM";
	VoiceMod.Speak(Текст,0); 
	VoiceMod = Неопределено; 
КонецПроцедуры
Показать
23. osivv 280 25.12.25 17:15 Сейчас в теме
(22)
Процедура Сказать(Текст)
VoiceMod = Новый COMОбъект("SAPI.SpVoice");
VoiceMod.Rate = 2;
VoiceMod.Priority = 0;
VoiceMod.EventInterests = 0;
VoiceMod.Volume = 70;
VoiceMod.Voice.Category.Default = "HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Speech_OneCore\Voices­­\Tokens\MSTTS_V110_ruRU_PavelM";
VoiceMod.Speak(Текст,0);
VoiceMod = Неопределено;
КонецПроцедуры

Спасибо.
21. kras_71 93 25.12.25 16:51 Сейчас в теме
Можно подключать к пустой.
Прикрепленные файлы:
24. osivv 280 25.12.25 17:15 Сейчас в теме
(21) Спасибо за ответы.
Для отправки сообщения требуется регистрация/авторизация