Развивайте вашу производительность: Извлечение текста из изображений в решениях 1С локально и безопасно

27.08.24

Интеграция - Распознавание документов и образов

В современном мире, где информация поступает из различных источников, необходимость быстро и эффективно извлекать текст из изображений становится важной частью рабочего процесса. Предлагаю простой способ, который поможет вам это сделать локально и безопасно всего за несколько простых шагов!

Скачать файл

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование По подписке [?] Купить один файл
Внешняя компонента AddIn.OCR.zip
.zip 13,02Kb
2
2 Скачать (1 SM) Купить за 1 850 руб.

Почему это важно?

Извлечение текста из изображений не только экономит время, но и помогает упростить рабочие процессы, минимизируя риск ошибок, связанных с ручным вводом текста. Это решение отлично подходит для делопроизводителей - операторов ввода данных в систему 1С: Документооборот и всех, кто работает с текстовой информацией в визуальном формате.

Технические требования

  1. Операционная система Windows 7-10
  2. Установленный .NET Framework 4.8
  3. Установленное прикладное решение на платформе 1С версии 8.3.18 и выше
  4. Запущенный контейнер с Docker приложением Flask+Tesseract
  5. Внешняя компонента AddIn.OCR.dll работает ТОЛЬКО с Docker приложением

ВНИМАНИЕ !

Внешняя компонента работает только с Docker приложением https://gitverse.ru/dgmcomru/imagemagick

Быстрый старт

  1. Разверните и запустите Docker приложение по инструкции
  2. Выполните регистрацию внешней компоненты в системе. Для клиента 1С (x32) запустите с правами администратора (RegAddIntlb32.bat), для (х64) соответственно (RegAddIntlb64.bat)
  3. Если Docker приложение запущено на другом ПК, измените в обработке строку ИзвлеченныйТекст = ВК.ВыполнитьИзвлечение("localhost:5000"); укажите правильное сетевое наименование.

Пошаговое руководство

Для пользователей Windows 7:

  1. Запуск приложения:
  • Откройте меню «Пуск», введите «Ножницы» в поисковой строке и запустите приложение.
  1. Выделение фрагмента экрана:
  • Используя мышь, выделите область изображения, содержащую нужный вам текст. Выделенный фрагмент будем автоматически скопирован в буфер обмена.

Для пользователей Windows 10 и выше:

  1. Выделение фрагмента экрана:
  • Используйте комбинацию клавиш Win + Shift + S, чтобы активировать инструмент набросок на фрагменте экрана.
  • С помощью мыши выделите нужную область текста. Выделенный фрагмент будем автоматически скопирован в буфер обмена.

Извлечение текста:

  • Откройте или запустите обработку. Специальная кнопка «Извлечь текст» сделает всю остальную магию — текст будет извлечен и отобразится на вашем экране, а также автоматически окажется в буфере обмена.

Универсальное применение и удобство

  • Мгновенная доступность: Извлеченный текст сразу же доступен в буфере обмена.
  • Интуитивная вставка: Воспользуйтесь сочетанием клавиш <Ctrl+V> для быстрой и удобной вставки текста в ваши документы, письма или презентации.

Преимущества использования инструмента:

  • Локальная обработка данных - внутри локальной сети или одного персонального компьютера.
  • Снижение трудозатрат и ошибок: Автоматизация процессов извлечения информации.
  • Удобство и скорость: Простота в эксплуатации и мгновенный результат.

Начните использовать инструмент уже сегодня!

Пример вызова внешней компоненты

&НаКлиенте
Перем ВК;

&НаКлиенте
Процедура ПриОткрытии(Отказ)
	
	Компонента = "AddIn.OCRimagemagick";
	
	Попытка
		Если ПодключитьВнешнююКомпоненту(Компонента) Тогда
			ВК = Новый (Компонента);
			Сообщить("Компонента подключена OCRimagemagick");
		Иначе 
			Сообщить("Ошибка подключения OCRimagemagick");
		КонецЕсли;	
	Исключение
		Сообщить("Ошибка загрузки OCRimagemagick");
	КонецПопытки;
	
КонецПроцедуры

&НаКлиенте
Процедура КомандаИзвлечь(Команда)
	
	ИзвлеченныйТекст = ВК.ВыполнитьИзвлечение("localhost:5000");
	
КонецПроцедуры

 

Комплект поставки:

Внешняя компонента (AddIn.OCR.zip)

Архив включает в себя:
1C.AddIn.OCR.dll - библиотека внешней компоненты;
RegAddIntlb32.bat - установочный файл регистрации компоненты для приложения клиента 1С 32бит;
RegAddIntlb64.bat - установочный файл регистрации компоненты для приложения клиента 1С 64бит;
UnRegAddIntlb32.bat - установочный файл отмены регистрации компоненты для приложения клиента 1С 32бит;
UnRegAddIntlb64.bat - установочный файл отмены регистрации компоненты для приложения клиента 1С 64бит;
Извлечение текста.epf - обработка пример использования внешней компоненты.

 

Проект в свободном доступе

Проект AddIn.OCR на GitVerse

Буду рад, если вы оцените этот проект и решите присоединиться к его развитию.

Проверено на следующих конфигурациях и релизах:

  • Документооборот КОРП, релизы 1.4.11.2

Документооборот OCR распознавание извлечение

См. также

SALE! 30%

Загрузка и выгрузка в Excel Документооборот и делопроизводство (СЭД) Учет документов Распознавание документов и образов Бухгалтер Пользователь Управляемые формы 1С:Комплексная автоматизация 1.х 1С:Бухгалтерия 2.0 1С:Управление торговлей 10 1С:Розница 2 1С:Управление производственным предприятием 1С:Управление нашей фирмой 1.6 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Управление холдингом 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 Бухгалтерский учет Управленческий учет Платные (руб)

Универсальная программа для распознавания сканов или фото товарных документов в 1С. Не требует указания параметров и предварительной настройки. Просто выбираете файл (PDF, JPG, DOC, XLS, HTML) выбираете документ 1С и нажимаете кнопку "Распознать и загрузить".

8400 5880 руб.

04.06.2019    105879    2463    173    

322

Разработка внешних компонент POS терминал Рабочее место Розничная торговля Программист Пользователь Платформа 1С v8.3 1С:Комплексная автоматизация 1.х 1С:Управление торговлей 10 1С:Розница 2 1С:Управление нашей фирмой 1.6 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х Розничная и сетевая торговля (FMCG) Рестораны, кафе и фаст-фуд Реклама, PR и маркетинг Управленческий учет Платные (руб)

Медиадисплей покупателя может отображать текущую покупку на кассовом месте, показывать видеорекламу, баннеры, во время простоя разворачивать рекламу на весь экран. Экран можно использовать в качестве графического меню-борда в кафе и видеовывески. В качестве устройства отображения можно использовать Android-планшеты, смарт-телевизоры с Android, мониторы или проекторы под управлением Windows или Linux-компьютера. Linux-версия успешно запускается на одноплатных компьютерах Raspberri Pi и Orange Pi. Настраивается ЛЮБОЙ ДИЗАЙН экрана при помощи встроенного графического редактора! Решение можно масштабировать от одного экрана до тысяч экранов с централизованным управлением.

15000 руб.

30.05.2017    53394    8    69    

45

Учет документов Распознавание документов и образов Бухгалтер Пользователь Платформа 1С v8.3 Конфигурации 1cv8 Платные (руб)

Расширение для типовых конфигурация и для самостоятельной интеграции системы распознавания документо удостоверяющих личность и прочих документов непосредственно из информационных баз "1С:Предприятия 8.3" с помощью Content AI - Passport Reader SDK. Расширение позволит не изменяя типовой код конфигурации, расширить текущий функционал несколькими кликами мыши.

12000 руб.

26.01.2016    69786    78    1    

102

Разработка внешних компонент Программист Платформа 1С v8.3 Конфигурации 1cv8 1С:Управление нашей фирмой 1.6 1С:Бухгалтерия 3.0 Платные (руб)

Внешняя компонента позволяет работать c TWAIN-совместимым оборудованием (сканерами, камерами) . Полностью совместима со стандартной TWAIN-компонентой из БСП и может применяться как ее замена без изменения вызовов, при этом может работать с 64-разрядной платформой, а так же имеет расширенную функциональность, например, сохранение результата непосредственно в PDF без использования сторонних утилит. Прекрасно работает на сервере, тонком клиенте и веб-клиенте (проверена работа в браузерах Google Chrome, Mozilla Firefox и Microsoft Internet Explorer).

3000 руб.

12.05.2020    27773    137    98    

89

Разработка внешних компонент Программист Платформа 1С v8.3 Конфигурации 1cv8 Платные (руб)

Внешняя компонента позволяет печатать PDF файлы непосредственно из 1С, не используя при этом сторонних программ. Прекрасно работает на сервере, тонком клиенте и веб-клиенте. Основана на проекте PDFium из состава проекта Chromium/Chrome

1500 руб.

17.09.2018    36225    113    127    

114

Разработка внешних компонент Телефония, SIP Программист Платформа 1С v8.3 Конфигурации 1cv8 Россия Платные (руб)

Внешняя компонента выполнена по технологии Native API для 1С 8.х, обеспечивает доступ к программным АТС Asterisk (FreePBX, Elastix) через AMI интерфейс. Через него можно управлять многими функциями Asterisk (определение номеров, перевод звонков, набор телефона и т. д.)

2400 руб.

04.05.2018    46420    119    66    

64

Разработка внешних компонент Программист Платформа 1С v8.3 Платформа 1C v8.2 Платные (руб)

Внешняя компонента, позволяющая посылать команды и получать ответы по GraphQL протоколу из 1С.Может быть использована при интеграции. В 1С работает на стороне "клиента".

4600 руб.

27.06.2023    3216    2    0    

3

Разработка внешних компонент Программист Платформа 1С v8.3 Конфигурации 1cv8 Платные (руб)

Внешняя компонента в виде библиотеки (.dll файл), позволяющая посылать команды и получать ответы по протоколу WebSocket из 1С. Компонента работает только на стороне "клиента".

4440 руб.

22.06.2020    17884    17    33    

21
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. PerlAmutor 130 28.08.24 06:48 Сейчас в теме
К сожалению Tesseract достаточно устаревшая библиотека, которая не использует новые нейросети. Пробовал использовать "из-коробки", справляется отвратительно.Тот мусор, что она выдает практически нигде нельзя использовать. Вероятно если её натренировать на своих данных она еще справится, но я бы смотрел в сторону других решений.
romanichenko; Ростислав24; akR00b; +3 Ответить
2. romanichenko 10 28.08.24 09:48 Сейчас в теме
(1) Спасибо за комментарий. Прошу, поделитесь опытом использования "других решений", буду признателен. А что касается мусора, он есть только на откровенно плохих скан-копиях или с артефактами на тексте, в остальном по моему скромному мнению неплохо.
Оставьте свое сообщение