Развивайте вашу производительность: Извлечение текста из изображений в решениях 1С локально и безопасно

27.08.24

Интеграция - Распознавание документов и образов

В современном мире, где информация поступает из различных источников, необходимость быстро и эффективно извлекать текст из изображений становится важной частью рабочего процесса. Предлагаю простой способ, который поможет вам это сделать локально и безопасно всего за несколько простых шагов!

Скачать файл

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование По подписке [?] Купить один файл
Внешняя компонента AddIn.OCR.zip
.zip 13,02Kb
2
2 Скачать (1 SM) Купить за 1 850 руб.

Почему это важно?

Извлечение текста из изображений не только экономит время, но и помогает упростить рабочие процессы, минимизируя риск ошибок, связанных с ручным вводом текста. Это решение отлично подходит для делопроизводителей - операторов ввода данных в систему 1С: Документооборот и всех, кто работает с текстовой информацией в визуальном формате.

Технические требования

  1. Операционная система Windows 7-10
  2. Установленный .NET Framework 4.8
  3. Установленное прикладное решение на платформе 1С версии 8.3.18 и выше
  4. Запущенный контейнер с Docker приложением Flask+Tesseract
  5. Внешняя компонента AddIn.OCR.dll работает ТОЛЬКО с Docker приложением

ВНИМАНИЕ !

Внешняя компонента работает только с Docker приложением https://gitverse.ru/dgmcomru/imagemagick

Быстрый старт

  1. Разверните и запустите Docker приложение по инструкции
  2. Выполните регистрацию внешней компоненты в системе. Для клиента 1С (x32) запустите с правами администратора (RegAddIntlb32.bat), для (х64) соответственно (RegAddIntlb64.bat)
  3. Если Docker приложение запущено на другом ПК, измените в обработке строку ИзвлеченныйТекст = ВК.ВыполнитьИзвлечение("localhost:5000"); укажите правильное сетевое наименование.

Пошаговое руководство

Для пользователей Windows 7:

  1. Запуск приложения:
  • Откройте меню «Пуск», введите «Ножницы» в поисковой строке и запустите приложение.
  1. Выделение фрагмента экрана:
  • Используя мышь, выделите область изображения, содержащую нужный вам текст. Выделенный фрагмент будем автоматически скопирован в буфер обмена.

Для пользователей Windows 10 и выше:

  1. Выделение фрагмента экрана:
  • Используйте комбинацию клавиш Win + Shift + S, чтобы активировать инструмент набросок на фрагменте экрана.
  • С помощью мыши выделите нужную область текста. Выделенный фрагмент будем автоматически скопирован в буфер обмена.

Извлечение текста:

  • Откройте или запустите обработку. Специальная кнопка «Извлечь текст» сделает всю остальную магию — текст будет извлечен и отобразится на вашем экране, а также автоматически окажется в буфере обмена.

Универсальное применение и удобство

  • Мгновенная доступность: Извлеченный текст сразу же доступен в буфере обмена.
  • Интуитивная вставка: Воспользуйтесь сочетанием клавиш <Ctrl+V> для быстрой и удобной вставки текста в ваши документы, письма или презентации.

Преимущества использования инструмента:

  • Локальная обработка данных - внутри локальной сети или одного персонального компьютера.
  • Снижение трудозатрат и ошибок: Автоматизация процессов извлечения информации.
  • Удобство и скорость: Простота в эксплуатации и мгновенный результат.

Начните использовать инструмент уже сегодня!

Пример вызова внешней компоненты

&НаКлиенте
Перем ВК;

&НаКлиенте
Процедура ПриОткрытии(Отказ)
	
	Компонента = "AddIn.OCRimagemagick";
	
	Попытка
		Если ПодключитьВнешнююКомпоненту(Компонента) Тогда
			ВК = Новый (Компонента);
			Сообщить("Компонента подключена OCRimagemagick");
		Иначе 
			Сообщить("Ошибка подключения OCRimagemagick");
		КонецЕсли;	
	Исключение
		Сообщить("Ошибка загрузки OCRimagemagick");
	КонецПопытки;
	
КонецПроцедуры

&НаКлиенте
Процедура КомандаИзвлечь(Команда)
	
	ИзвлеченныйТекст = ВК.ВыполнитьИзвлечение("localhost:5000");
	
КонецПроцедуры

 

Комплект поставки:

Внешняя компонента (AddIn.OCR.zip)

Архив включает в себя:
1C.AddIn.OCR.dll - библиотека внешней компоненты;
RegAddIntlb32.bat - установочный файл регистрации компоненты для приложения клиента 1С 32бит;
RegAddIntlb64.bat - установочный файл регистрации компоненты для приложения клиента 1С 64бит;
UnRegAddIntlb32.bat - установочный файл отмены регистрации компоненты для приложения клиента 1С 32бит;
UnRegAddIntlb64.bat - установочный файл отмены регистрации компоненты для приложения клиента 1С 64бит;
Извлечение текста.epf - обработка пример использования внешней компоненты.

 

Проект в свободном доступе

Проект AddIn.OCR на GitVerse

Буду рад, если вы оцените этот проект и решите присоединиться к его развитию.

Проверено на следующих конфигурациях и релизах:

  • Документооборот КОРП, релизы 1.4.11.2

Документооборот OCR распознавание извлечение

См. также

SALE! 30%

Загрузка и выгрузка в Excel Документооборот и делопроизводство (СЭД) Учет документов Распознавание документов и образов Бухгалтер Пользователь Управляемые формы 1С:Комплексная автоматизация 1.х 1С:Бухгалтерия 2.0 1С:Управление торговлей 10 1С:Розница 2 1С:Управление производственным предприятием 1С:Управление нашей фирмой 1.6 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Управление холдингом 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 Бухгалтерский учет Управленческий учет Платные (руб)

Универсальная программа для распознавания сканов или фото товарных документов в 1С. Не требует указания параметров и предварительной настройки. Просто выбираете файл (PDF, JPG, DOC, XLS, HTML) выбираете документ 1С и нажимаете кнопку "Распознать и загрузить".

8400 5880 руб.

04.06.2019    107327    313    173    

326

Учет документов Распознавание документов и образов Бухгалтер Пользователь Платформа 1С v8.3 Конфигурации 1cv8 Платные (руб)

Расширение для типовых конфигурация и для самостоятельной интеграции системы распознавания документо удостоверяющих личность и прочих документов непосредственно из информационных баз "1С:Предприятия 8.3" с помощью Content AI - Passport Reader SDK. Расширение позволит не изменяя типовой код конфигурации, расширить текущий функционал несколькими кликами мыши.

12000 руб.

26.01.2016    70018    79    2    

103

Разработка внешних компонент POS терминал Рабочее место Розничная торговля Программист Пользователь Платформа 1С v8.3 1С:Комплексная автоматизация 1.х 1С:Управление торговлей 10 1С:Розница 2 1С:Управление нашей фирмой 1.6 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х Розничная и сетевая торговля (FMCG) Рестораны, кафе и фаст-фуд Реклама, PR и маркетинг Управленческий учет Платные (руб)

Медиадисплей покупателя может отображать текущую покупку на кассовом месте, показывать видеорекламу, баннеры, во время простоя разворачивать рекламу на весь экран. Экран можно использовать в качестве графического меню-борда в кафе и видеовывески. В качестве устройства отображения можно использовать Android-планшеты, смарт-телевизоры с Android, мониторы или проекторы под управлением Windows или Linux-компьютера. Linux-версия успешно запускается на одноплатных компьютерах Raspberri Pi и Orange Pi. Настраивается ЛЮБОЙ ДИЗАЙН экрана при помощи встроенного графического редактора! Решение можно масштабировать от одного экрана до тысяч экранов с централизованным управлением.

18000 руб.

30.05.2017    53751    9    69    

46

Разработка внешних компонент Телефония, SIP Программист Платформа 1С v8.3 Конфигурации 1cv8 Россия Платные (руб)

Внешняя компонента выполнена по технологии Native API для 1С 8.х, обеспечивает доступ к программным АТС Asterisk (FreePBX, Elastix) через AMI интерфейс. Через него можно управлять многими функциями Asterisk (определение номеров, перевод звонков, набор телефона и т. д.)

2400 руб.

04.05.2018    46873    122    66    

66

Разработка внешних компонент Программист Платформа 1С v8.3 Конфигурации 1cv8 1С:Управление нашей фирмой 1.6 1С:Бухгалтерия 3.0 Платные (руб)

Внешняя компонента позволяет работать c TWAIN-совместимым оборудованием (сканерами, камерами) . Полностью совместима со стандартной TWAIN-компонентой из БСП и может применяться как ее замена без изменения вызовов, при этом может работать с 64-разрядной платформой, а так же имеет расширенную функциональность, например, сохранение результата непосредственно в PDF без использования сторонних утилит. Прекрасно работает на сервере, тонком клиенте и веб-клиенте (проверена работа в браузерах Google Chrome, Mozilla Firefox и Microsoft Internet Explorer).

3000 руб.

12.05.2020    28321    138    100    

90

Разработка внешних компонент Программист Платформа 1С v8.3 Конфигурации 1cv8 1С:Управление торговлей 11 Платные (руб)

Внешняя компонента для конвертации PDF файлов в картинки без использования дополнительных программ. Работает на сервере и в тонком клиенте.

2400 руб.

25.06.2024    917    2    3    

2

Разработка внешних компонент Программист Платформа 1С v8.3 Платформа 1C v8.2 Платные (руб)

Внешняя компонента, позволяющая посылать команды и получать ответы по GraphQL протоколу из 1С.Может быть использована при интеграции. В 1С работает на стороне "клиента".

4600 руб.

27.06.2023    3431    2    0    

4

Разработка внешних компонент Программист Платформа 1С v8.3 Конфигурации 1cv8 Платные (руб)

Внешняя компонента в виде библиотеки (.dll файл), позволяющая посылать команды и получать ответы по протоколу WebSocket из 1С. Компонента работает только на стороне "клиента".

4440 руб.

22.06.2020    18184    18    33    

22
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. PerlAmutor 155 28.08.24 06:48 Сейчас в теме
К сожалению Tesseract достаточно устаревшая библиотека, которая не использует новые нейросети. Пробовал использовать "из-коробки", справляется отвратительно.Тот мусор, что она выдает практически нигде нельзя использовать. Вероятно если её натренировать на своих данных она еще справится, но я бы смотрел в сторону других решений.
romanichenko; Ростислав24; akR00b; +3 Ответить
2. romanichenko 11 28.08.24 09:48 Сейчас в теме
(1) Спасибо за комментарий. Прошу, поделитесь опытом использования "других решений", буду признателен. А что касается мусора, он есть только на откровенно плохих скан-копиях или с артефактами на тексте, в остальном по моему скромному мнению неплохо.
Оставьте свое сообщение