Развивайте вашу производительность: Извлечение текста из изображений в решениях 1С локально и безопасно

27.08.24

Интеграция - Распознавание документов и образов

В современном мире, где информация поступает из различных источников, необходимость быстро и эффективно извлекать текст из изображений становится важной частью рабочего процесса. Предлагаю простой способ, который поможет вам это сделать локально и безопасно всего за несколько простых шагов!

Скачать файл

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование По подписке [?] Купить один файл
Внешняя компонента AddIn.OCR.zip
.zip 13,02Kb
2
2 Скачать (1 SM) Купить за 1 850 руб.

Почему это важно?

Извлечение текста из изображений не только экономит время, но и помогает упростить рабочие процессы, минимизируя риск ошибок, связанных с ручным вводом текста. Это решение отлично подходит для делопроизводителей - операторов ввода данных в систему 1С: Документооборот и всех, кто работает с текстовой информацией в визуальном формате.

Технические требования

  1. Операционная система Windows 7-10
  2. Установленный .NET Framework 4.8
  3. Установленное прикладное решение на платформе 1С версии 8.3.18 и выше
  4. Запущенный контейнер с Docker приложением Flask+Tesseract
  5. Внешняя компонента AddIn.OCR.dll работает ТОЛЬКО с Docker приложением

ВНИМАНИЕ !

Внешняя компонента работает только с Docker приложением https://gitverse.ru/dgmcomru/imagemagick

Быстрый старт

  1. Разверните и запустите Docker приложение по инструкции
  2. Выполните регистрацию внешней компоненты в системе. Для клиента 1С (x32) запустите с правами администратора (RegAddIntlb32.bat), для (х64) соответственно (RegAddIntlb64.bat)
  3. Если Docker приложение запущено на другом ПК, измените в обработке строку ИзвлеченныйТекст = ВК.ВыполнитьИзвлечение("localhost:5000"); укажите правильное сетевое наименование.

Пошаговое руководство

Для пользователей Windows 7:

  1. Запуск приложения:
  • Откройте меню «Пуск», введите «Ножницы» в поисковой строке и запустите приложение.
  1. Выделение фрагмента экрана:
  • Используя мышь, выделите область изображения, содержащую нужный вам текст. Выделенный фрагмент будем автоматически скопирован в буфер обмена.

Для пользователей Windows 10 и выше:

  1. Выделение фрагмента экрана:
  • Используйте комбинацию клавиш Win + Shift + S, чтобы активировать инструмент набросок на фрагменте экрана.
  • С помощью мыши выделите нужную область текста. Выделенный фрагмент будем автоматически скопирован в буфер обмена.

Извлечение текста:

  • Откройте или запустите обработку. Специальная кнопка «Извлечь текст» сделает всю остальную магию — текст будет извлечен и отобразится на вашем экране, а также автоматически окажется в буфере обмена.

Универсальное применение и удобство

  • Мгновенная доступность: Извлеченный текст сразу же доступен в буфере обмена.
  • Интуитивная вставка: Воспользуйтесь сочетанием клавиш <Ctrl+V> для быстрой и удобной вставки текста в ваши документы, письма или презентации.

Преимущества использования инструмента:

  • Локальная обработка данных - внутри локальной сети или одного персонального компьютера.
  • Снижение трудозатрат и ошибок: Автоматизация процессов извлечения информации.
  • Удобство и скорость: Простота в эксплуатации и мгновенный результат.

Начните использовать инструмент уже сегодня!

Пример вызова внешней компоненты

&НаКлиенте
Перем ВК;

&НаКлиенте
Процедура ПриОткрытии(Отказ)
	
	Компонента = "AddIn.OCRimagemagick";
	
	Попытка
		Если ПодключитьВнешнююКомпоненту(Компонента) Тогда
			ВК = Новый (Компонента);
			Сообщить("Компонента подключена OCRimagemagick");
		Иначе 
			Сообщить("Ошибка подключения OCRimagemagick");
		КонецЕсли;	
	Исключение
		Сообщить("Ошибка загрузки OCRimagemagick");
	КонецПопытки;
	
КонецПроцедуры

&НаКлиенте
Процедура КомандаИзвлечь(Команда)
	
	ИзвлеченныйТекст = ВК.ВыполнитьИзвлечение("localhost:5000");
	
КонецПроцедуры

 

Комплект поставки:

Внешняя компонента (AddIn.OCR.zip)

Архив включает в себя:
1C.AddIn.OCR.dll - библиотека внешней компоненты;
RegAddIntlb32.bat - установочный файл регистрации компоненты для приложения клиента 1С 32бит;
RegAddIntlb64.bat - установочный файл регистрации компоненты для приложения клиента 1С 64бит;
UnRegAddIntlb32.bat - установочный файл отмены регистрации компоненты для приложения клиента 1С 32бит;
UnRegAddIntlb64.bat - установочный файл отмены регистрации компоненты для приложения клиента 1С 64бит;
Извлечение текста.epf - обработка пример использования внешней компоненты.

 

Проект в свободном доступе

Проект AddIn.OCR на GitVerse

Буду рад, если вы оцените этот проект и решите присоединиться к его развитию.

Проверено на следующих конфигурациях и релизах:

  • Документооборот КОРП, релизы 1.4.11.2

Документооборот OCR распознавание извлечение

См. также

SALE! 30%

Загрузка и выгрузка в Excel Документооборот и делопроизводство (СЭД) Учет документов Распознавание документов и образов Бухгалтер Пользователь Управляемые формы 1С:Комплексная автоматизация 1.х 1С:Бухгалтерия 2.0 1С:Управление торговлей 10 1С:Розница 2 1С:Управление производственным предприятием 1С:Управление нашей фирмой 1.6 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Управление холдингом 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 Бухгалтерский учет Управленческий учет Платные (руб)

Универсальная программа для распознавания сканов или фото товарных документов в 1С. Не требует указания параметров и предварительной настройки. Просто выбираете файл (PDF, JPG, DOC, XLS, HTML) выбираете документ 1С и нажимаете кнопку "Распознать и загрузить".

8400 5880 руб.

04.06.2019    108270    315    173    

327

Разработка внешних компонент POS терминал Рабочее место Розничная торговля Программист Пользователь Платформа 1С v8.3 1С:Комплексная автоматизация 1.х 1С:Управление торговлей 10 1С:Розница 2 1С:Управление нашей фирмой 1.6 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х Розничная и сетевая торговля (FMCG) Рестораны, кафе и фаст-фуд Реклама, PR и маркетинг Управленческий учет Платные (руб)

Медиадисплей покупателя может отображать текущую покупку на кассовом месте, показывать видеорекламу, баннеры, во время простоя разворачивать рекламу на весь экран. Экран можно использовать в качестве графического меню-борда в кафе и видеовывески. В качестве устройства отображения можно использовать Android-планшеты, смарт-телевизоры с Android, мониторы или проекторы под управлением Windows или Linux-компьютера. Linux-версия успешно запускается на одноплатных компьютерах Raspberri Pi и Orange Pi. Настраивается ЛЮБОЙ ДИЗАЙН экрана при помощи встроенного графического редактора! Решение можно масштабировать от одного экрана до тысяч экранов с централизованным управлением.

18000 руб.

30.05.2017    54039    9    69    

46

Разработка внешних компонент Программист Платформа 1С v8.3 Конфигурации 1cv8 1С:Управление торговлей 11 Платные (руб)

Внешняя компонента для конвертации PDF файлов в картинки без использования дополнительных программ. Работает на сервере и в тонком клиенте.

2400 руб.

25.06.2024    1126    3    4    

3

Разработка внешних компонент Телефония, SIP Программист Платформа 1С v8.3 Конфигурации 1cv8 Россия Платные (руб)

Внешняя компонента выполнена по технологии Native API для 1С 8.х, обеспечивает доступ к программным АТС Asterisk (FreePBX, Elastix) через AMI интерфейс. Через него можно управлять многими функциями Asterisk (определение номеров, перевод звонков, набор телефона и т. д.)

2400 руб.

04.05.2018    47297    124    66    

67

SALE! 30%

Учет документов Распознавание документов и образов Бухгалтер Пользователь Платформа 1С v8.3 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х Россия Платные (руб)

Одна из наиболее удобных обработок автоматического прикрепления большого количества документов-оригиналов к документам 1С. Для файлов поточного сканирования автоматически определяются начало и конец каждого документа. Поддерживаются штрихкоды, QR-коды, отсканированные PDF документы без штрихкодов, сформированные в ЭДО текстовые PDF документы. Поддерживаются входящие и исходящие документы-оригиналы.

6480 руб.

23.12.2021    13388    17    25    

10

Разработка внешних компонент Программист Платформа 1С v8.3 Платформа 1C v8.2 Платные (руб)

Внешняя компонента, позволяющая посылать команды и получать ответы по GraphQL протоколу из 1С.Может быть использована при интеграции. В 1С работает на стороне "клиента".

4600 руб.

27.06.2023    3598    3    0    

5

Разработка внешних компонент Программист Платформа 1С v8.3 Конфигурации 1cv8 Платные (руб)

Позволяет автоматизировать работу с картинками. С помощью компоненты можно измерять размер изображений, поворачивать их, наносить водяные знаки, конвертировать из одного формата в другой. Будет очень полезна для интернет-магазинов и всех, кому постоянно требуется работать с различными графическими форматами. Выполнена по технологии NativeAPI. Работает с форматами: jpg (jpeg), png, bmp, gif, tif

3600 руб.

02.09.2010    77515    72    257    

191

Разработка внешних компонент Программист Платформа 1С v8.3 Конфигурации 1cv8 1С:Управление нашей фирмой 1.6 1С:Бухгалтерия 3.0 Платные (руб)

Внешняя компонента позволяет работать c TWAIN-совместимым оборудованием (сканерами, камерами) . Полностью совместима со стандартной TWAIN-компонентой из БСП и может применяться как ее замена без изменения вызовов, при этом может работать с 64-разрядной платформой, а так же имеет расширенную функциональность, например, сохранение результата непосредственно в PDF без использования сторонних утилит. Прекрасно работает на сервере, тонком клиенте и веб-клиенте (проверена работа в браузерах Google Chrome, Mozilla Firefox и Microsoft Internet Explorer).

3000 руб.

12.05.2020    28655    138    100    

91
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. PerlAmutor 155 28.08.24 06:48 Сейчас в теме
К сожалению Tesseract достаточно устаревшая библиотека, которая не использует новые нейросети. Пробовал использовать "из-коробки", справляется отвратительно.Тот мусор, что она выдает практически нигде нельзя использовать. Вероятно если её натренировать на своих данных она еще справится, но я бы смотрел в сторону других решений.
romanichenko; Ростислав24; akR00b; +3 Ответить
2. romanichenko 11 28.08.24 09:48 Сейчас в теме
(1) Спасибо за комментарий. Прошу, поделитесь опытом использования "других решений", буду признателен. А что касается мусора, он есть только на откровенно плохих скан-копиях или с артефактами на тексте, в остальном по моему скромному мнению неплохо.
Оставьте свое сообщение