Ввод данных в 1С голосом, ничего не настраивая и без абонентской платы!

12.02.25

Вам нравится набирать сообщения и другую информацию в телефоне голосом? Вы хотите делать то же самое на компьютере? С помощью голосового ввода Вы можете упростить работу с текстом на компьютере, транскрибируя речь в реальном времени с SimpleVoiceInput.

Локальное приложение

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование	Скачано	Купить файл (только для физ. лиц)	По подписке PRO
SimpleVoiceInput (локальное приложение) .zip 75,54Mb ver:1.0.0.1 6	6	2 450 руб. Купить	3 SM Скачать

Клиент-серверный вариант

Наименование	Скачано	Купить файл (только для физ. лиц)	По подписке PRO
SimpleVoiceInput (клиент-серверный вариант) .zip 177,24Mb ver:1.0.0.1 7	7	3 350 руб. Купить	6 SM Скачать

Исходный код

Наименование	Скачано	Купить файл (только для физ. лиц)	По подписке PRO
Исходный код SimpleVoiceInput .zip 2,82Kb 3	3	4 550 руб. Купить	10 SM Скачать

Откуда появилась идея создания приложения

На смартфонах большинство из нас пользуются различными мессенджерами, мы делаем заметки, иногда пишем тексты и многие делают это, используя голосовой ввод. При этом в смартфоне речь распознаётся в режиме реального времени и вставляется в нужное место в виде текста. Лично мне это очень нравится. Это максимально удобно в поездках, по пути на работу. Я этой функцией пользуюсь регулярно, при условии, что это не мешает окружающим. Мне давно хотелось иметь подобную функцию на компьютере, при этом желательно, чтобы она работала вне зависимости, есть ли у меня доступ к интернету или нет. Голосовой ввод от Майкрософта, к сожалению, на русском языке не работает. Сторонних программ, которые бы позволяли транскрибировать речь и вставлять результат в любое поле, любого приложения, тоже не нашёл. В результате я решил попробовать написать свою программу, которая бы закрыла этот вопрос.

Требования к будущей программе:

ПО должно работать на старом и новом железе.
ПО должно работать в локальном режиме.
За основу для транскрибации должно браться стороннее ПО с открытым исходным кодом и доступной лицензией. Так же это ПО должно иметь API или же запускаться в консольном режиме с параметрами. А еще желательно, чтобы это ПО также могло восстанавливать пунктуацию.
Насколько мне известно вставка в текущее поле любого приложения не всегда возможна, из-за фундаментальных ограничений безопасности ОС. В связи с этим необходимо свести к минимуму проблемы со вставкой текста в текущее окно.

Что взял за основу для создания своего приложения.

Изучив текущий рынок подобного программного обеспечения пришёл к выводу, что за основу необходимо взять локальный ИИ для транскрибации текста. Мой выбор пал на модели VOSK, так как они удовлетворяют всем требованиям к разрабатываемому программному обеспечению.

Кратко о VOSK

VOSK - библиотека для распознавания речи.

Преимущества библиотеки:

Поддерживает 20+ языков и диалектов - русский, английский, немецкий, французский, португальский, испанский, китайский и пр.
Работает без доступа к сети даже на мобильных устройствах - Raspberry Pi, Android, iOS
Модели для каждого языка занимают всего 50Мб, но есть и большие модели для более точного распознавания
Сделана для потоковой обработки звука, что позволяет реализовать мгновенную реакцию на команды
Поддерживает несколько популярных языков программирования - Java, C#, Javascript
Позволяет быстро настраивать словарь распознавания для улучшения точности распознавания
Позволяет идентифицировать говорящего

Сравнение моделей по транскрибации речи.

Если интересно, то есть таблица протестированных доступных моделей для распознавания русской речи на различных наборах данных. Посмотреть можно по этой ссылке..

Результаты сравнения моделей взяты с этого же сайта и перечислены ниже:

Nemo RNNT очень быстрый и довольно точный
Vosk начитанный и быстрый.
Whisper не очень хорошо работает для русского и его тяжело дообучить. Тем не менее на Silero он дообучился.
Whisper медленный, но даже на старой карте вполне удовлетворительный. Когда-то давно 10xRT считалось хорошей скоростью распознавания.
Wav2Vec переобучен на CommonVoice, в целом модель не очень хороша. Имеет смысл попробовать его с другой моделью языка, может будет получше.

Кратко о процессе создания программы

В качестве языка разработки был выбран Python (я на нем периодически пишу для себя программы и различные скрипты по автоматизации рутинных задач).

Самой сложной задачей в процессе разработки была, наверное, вставка текста в текущее поле на экране. В процессе разработки было опробовано много вариантов решения этой задачи. К сожалению, универсального кроссплатформенного решения я не нашёл, поэтому текущая версия программы под Windows. Если программа вызовет интерес у пользователей, то возможно, сделаю поддержку Linux.
Замечу, что в клиент - серверном варианте на сервере появляется консольное окно, помимо иконки в трее. Данное решение было обосновано тем, чтобы пользователь видел процесс загрузки приложения. Этот процесс может занимает довольно много времени и на старом железе пользователи могут не понимать, почему не работает приложение.

Отдельного окошка по настройке приложения делать пока не стал (добавлю в будущих версиях). Вся информация по смене сочетания клавиш записи речи и выбора сервера содержится в конфигурационном файле.

Что я сделал

В процессе работы появился SimpleVoiceInput.

SimpleVoiceInput — два приложения для транскрибации русской речи в реальном времени, которые работают либо на локальном компьютере, либо в локальной сети, гарантируя полную конфиденциальность вашей информации. Эти решения идеально подходят для пользователей 1С и всех, кто работает с текстами, но не хочет рисковать утечкой данных.

Что предлагает SimpleVoiceInput?

Мои приложения используют передовые технологии распознавания речи на основе моделей VOSK. Они просты в использовании, не требуют интеграции с 1С и работают почти на любом компьютере. Вы можете выбрать решение, которое лучше всего подходит для ваших задач.

1. Локальное приложение

Это приложение работает исключительно на вашем компьютере и использует младшую модель VOSK, которая обеспечивает быструю и точную транскрибацию текста. Оно идеально подходит для задач, где не требуется восстановление пунктуации и регистра.

Преимущества:

Работает полностью автономно на вашем компьютере.
Простота установки и использования.
Автоматическая вставка текста в текущее место на экране.
Подходит для любых задач, не только для работы с 1С.

2. Клиент-серверное приложение

Это решение работает в локальной сети и состоит из легкого клиента на вашем компьютере и серверной части, которая использует несколько моделей VOSK. Первая модель отвечает за транскрибацию, а вторая — за восстановление пунктуации и регистра текста, что делает результат максимально точным и читаемым.

Особенности серверной части:

Серверная часть может быть установлена на локальный компьютер, но для ее работы потребуется не менее 8 ГБ оперативной памяти и современное железо.
При запуске серверной части происходит загрузка моделей VOSK в память, что может занять от 20 секунд до нескольких минут. Однако после загрузки скорость транскрибации остается высокой и стабильной.
Клиентская часть работает быстро и не требует значительных ресурсов, так как основная нагрузка ложится на сервер.

Преимущества:

Высокая точность благодаря использованию нескольких моделей.
Работает в локальной сети, обеспечивая безопасность данных.
Минимальная нагрузка на ваш компьютер благодаря легкому клиенту.
Автоматическая вставка текста в текущее место на экране.
Подходит для любых задач, не только для работы с 1С.

Как работает SimpleVoiceInput?

Использование приложений максимально простое:

Нажмите и удерживайте заданное сочетание клавиш (например, Ctrl + Shift + X).
На экране появится пиктограмма записи — начинайте наговаривать текст.
Отпустите сочетание клавиш, и текст автоматически вставится в текущее место на экране.

Важно: Сочетание клавиш можно изменить в конфигурационном файле.

Почему SimpleVoiceInput?

Безопасность: Локальное приложение работает автономно, а клиент-серверное — в локальной сети, что исключает риск утечки конфиденциальных данных.
Простота: Никаких сложных настроек или интеграций с 1С. Приложения готовы к использованию сразу после установки.
Универсальность: Подходят для любых задач, по голосовому вводу.
Экономия времени: Транскрибация в реальном времени позволяет вам сосредоточиться на важных задачах, не отвлекаясь на ручной ввод текста.

Кому это будет полезно?

Пользователи 1С: Ускорьте ввод данных и снизьте количество ошибок без необходимости доработок в 1С.
Специалисты по документации: Наговаривайте текст и автоматически вставляйте в нужные документы.
Все, кто работает с текстами: SimpleVoiceInput подходит для любых задач, где требуется быстрая и точная транскрибация речи.

Как начать?

Если вы используете локальное решение:

Создайте каталог, полный путь которого не будет содержать кириллицы. (Например, "C:\InputText\".)
Скачайте и распакуйте SimpleVoiceInput в данный каталог.
Запустите файл "SimpleVoiceInput.exe"

Если вы используете клиент-серверный вариант:

Распаковываем скачанный архив.
Внутри архива видим 2 папки: "SimpleVoiceInputClient" и "SimpleVoiceInputServer"
На сервере:
1. Копируем каталог "SimpleVoiceInputServer" на сервер. Полный путь к данному каталогу не должен содержать кириллицу.
2. Качаем большую модель Vosk с официального сайта vosk-model-ru-0.42 и разархивируем её.
3. Получаем папку "vosk-model-ru-0.42", содержащую подпапки и файлы. Данную папку копируем в "\SimpleVoiceInputServer\_internal\".
4. Качаем модель пунктуации Vosk vosk-recasepunc-ru-0.22 и разархивируем её.
5. Получаем папку "vosk-recasepunc-ru-0.22", содержащую файл "checkpoint". Копируем данный файл в "\SimpleVoiceInputServer\_internal\".
6. В папке "\SimpleVoiceInputServer\_internal\" есть файл "config.json", в котором установлен порт соединения с сервером. По умолчанию порт "5050". Если необходимо меняем на свой. Порт на сервере должен быть открыт.
7. Запускаем серверное приложение с помощью файла "SimpleVoiceInputServer.exe".
На Клиенте
1. В папке "SimpleVoiceInputClient" в подкаталоге "_internal" ищем и открываем файл "config.json".
2. В файле "config.json" в строке "server_url": "http://127.0.0.1:5000" меняем IP адрес и порт, на адрес вашего сервера. Например, должно получиться "server_url": "http://192.168.20.171:5050", если порт не был изменен на сервере.
3. Копируем "SimpleVoiceInputClient" на компьютеры пользователей.
4. Запускаем приложение с помощью файла "SimpleVoiceInputClient.exe".
5. Выделяем поле, зажимаем и удерживаем клавиши "Ctrl+Shift+X" и наговариваем текст. Результат увидим в данном поле.

Демонстрация работы программы :

Кому интересно, как устроена программа внутри, могут скачать и посмотреть исходник на python.

Все тесты проводились на Windows 10.

Ссылки на другие работы автора:

+8 –

См. также

MCP серверы для вайб кодинга в 1С

Администрирование веб-серверов Сервера Нейросети Программист Платные (руб)

Сервер поиска по метаданным и поиска по коду, Сервер экспорта и поиска по документации, Сервер синтаксической проверки кода

17.06.2025 2646 36 comol 5

Заполнение описания номенклатуры с помощью GigaChat

Нейросети Мастера заполнения 1С v8.3 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 Платные (руб)

Расширение для заполнения описания номенклатуры с помощью модели ИИ GigaChat от Сбера. Расширение формирует продающее описание товара по его наименованию с помощью модели искусственного интеллекта. Будет полезно для владельцев интернет магазинов, каталогов товаров и продающих через маркетплейсы. Адаптировано для основных конфигураций: УТ, ЕРП, КА, УНФ.

5000 руб.

08.11.2023 4210 16 0

Искусственный интеллект и нейросети в 1С: Работа с отзывами маркетплейсов

Нейросети Пользователь 1С v8.3 1С:Управление нашей фирмой 1.6 1С:Управление торговлей 11 1С:Управление нашей фирмой 3.0 Оптовая торговля, дистрибуция, логистика Россия Управленческий учет Платные (руб)

Расширение "Искусственный интеллект и нейросети в 1С: Работа с отзывами маркетплейсов" предназначено для применения искусственного интеллекта в повседневной деятельности селлеров на маркетплейсах. Среди функций - работа с отзывами, вопросами и чатами покупателей, диалог с нейросетями, генерация картинок, заполнение описаний номенклатуры и другое.

6000 руб.

03.04.2024 8584 4 0

ExcelAI Pro или Умный Excel для 1С

Нейросети 1С v8.3 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Управление нашей фирмой 3.0 Платные (руб)

Умный Excel" - ИИ-супердвигатель, который превращает часы работы в минуты! Технологии будущего уже здесь: загрузил Excel "магия ИИ" готовый результат

8400 руб.

02.07.2025 238 0 0

Стек разработки с ИИ для 1С

Нейросети Программист Бесплатно (free)

В публикации рассмотрим, какие AI инструменты сейчас применимы для разработки на 1С, и особенности их использования.

02.07.2025 2524 comol 9

Анализ продаж вместе с ИИ

Нейросети Анализ продаж Пользователь 1С v8.3 1С:Управление торговлей 11 Абонемент ($m)

Новая (портабельная) версия анализа продаж вместе с ИИ. Не требует установки расширения Библиотека искусственного интеллекта для 1С.

10 стартмани

17.06.2025 1336 9 mkalimulin 6

Инвестируем с 1С и Клод

Управление инвестициями Нейросети Финансовые услуги, инвестиции Бесплатно (free)

Вплоть до текущего года я скептически относился к новостям о нейросетях. Мне казалось, что всё это просто очередной хайп и уж точно они не скоро смогут помочь в чём-то разработчику ПО. Но решил немного поэкспериментировать с пет-проектом, который пылился уже пару лет. Результат меня удивил, поэтому решил поделиться опытом с вами.

16.06.2025 2806 oyti 3

Свой MCP-сервер для метаданных 1С

Нейросети Инструментарий разработчика Программист 1С v8.3 Абонемент ($m)

Для эффективного использования современных LLM им не хватает контекста об 1С, как минимум, знания структуры метаданных 1С, а еще лучше знаний БСП и синтакс-помощника :) Технология MCP помогает решать эту проблему. Под катом описание MVP-решения, которое можно далее дорабатывать под себя. Мне сильно не хватало подобной статьи, чтобы сэкономить бессонные ночи.

1 стартмани

16.06.2025 5896 22 FSerg 25

Комментарии

Подписаться на ответы Инфостарт бот

Свернуть все

1. Pim 190 17.02.25 18:13 Сейчас в теме

Ну, честно говоря, не очень.
1. не всегда "схватывает" речь. Возможно, проблема в Касперском.
2. пока не отпустишь клавиши, текст не появится.
3. часть длинных фраз с паузами теряет.
4. должна быть хорошая дикция, у меня многие слова путает.

2. Smikle 61 17.02.25 21:30 Сейчас в теме

Я думаю вы говорите про младшую модель.
Попробую ответить по пунктам.
п.1. Да действительно иногда бывают проблемы, но скорее не в Касперском. Очень сильно влияют шум вокруг вас или голоса других. Так же влияние оказывает качетство записи. Например на ноутбуке у меня микрофон хуже, чем я использую на компьютере и качество транскрибации поэтому на компьютере лучше. При частом использовании привыкаешь к программе и получается набирать довольно большие тексты за раз. Так же замечу, что качество транскрибации у большой модели мне нравится больше.
п.2. Да, все верно. Пока держим клавиши идет запись речи, как отпускаем сразу обрабатывается и мы видим результат
п.3. и п.4. У меня были подобные проблемы вначале, но сейчас уже очень редкие и это в основном касается младшей модели VOSK. У старшей проблем подобных не наблюдал.

Спасибо за обратную связь, я постоянно работаю над улучшением приложения и в следующих релизах постараюсь поправить проблемные моменты.

Оставьте свое сообщение

E-mail:

Автор:

(Smikle)

Рейтинг: 61

Для получения уведомлений о новых публикациях автора подключите телеграм бот: Инфостарт бот

Публикация:

№ 2302694

Создание 12.02.25 11:00

Обновление 12.02.25 11:00

Статистика:

Просмотры 1327

Загрузки 16

Рейтинг 8

Комментарии 2

Характеристики:

Код открыт Да

Рубрики Нейросети

Кому Программист ,
Пользователь

Тип файла Архив с данными

Платформа Не имеет значения

Конфигурация Универсальные

Операционная система Windows

Страна Не имеет значения

Отрасль Не имеет значения

Налоги Не имеет значения

Вид учета Не имеет значения

Доступ к файлу Абонемент ($m)