Почему это важно?
Извлечение текста из изображений не только экономит время, но и помогает упростить рабочие процессы, минимизируя риск ошибок, связанных с ручным вводом текста. Это решение отлично подходит для делопроизводителей - операторов ввода данных в систему 1С: Документооборот и всех, кто работает с текстовой информацией в визуальном формате.
Технические требования
- Операционная система Windows 7-10
- Установленный .NET Framework 4.8
- Установленное прикладное решение на платформе 1С версии 8.3.18 и выше
- Запущенный контейнер с Docker приложением Flask+Tesseract
- Внешняя компонента AddIn.OCR.dll работает ТОЛЬКО с Docker приложением
ВНИМАНИЕ !
Внешняя компонента работает только с Docker приложением https://gitverse.ru/dgmcomru/imagemagick
Быстрый старт
- Разверните и запустите Docker приложение по инструкции
- Выполните регистрацию внешней компоненты в системе. Для клиента 1С (x32) запустите с правами администратора (RegAddIntlb32.bat), для (х64) соответственно (RegAddIntlb64.bat)
- Если Docker приложение запущено на другом ПК, измените в обработке строку
ИзвлеченныйТекст = ВК.ВыполнитьИзвлечение("localhost:5000");
укажите правильное сетевое наименование.
Пошаговое руководство
Для пользователей Windows 7:
- Запуск приложения:
- Откройте меню «Пуск», введите «Ножницы» в поисковой строке и запустите приложение.
- Выделение фрагмента экрана:
- Используя мышь, выделите область изображения, содержащую нужный вам текст. Выделенный фрагмент будем автоматически скопирован в буфер обмена.
Для пользователей Windows 10 и выше:
- Выделение фрагмента экрана:
- Используйте комбинацию клавиш Win + Shift + S, чтобы активировать инструмент набросок на фрагменте экрана.
- С помощью мыши выделите нужную область текста. Выделенный фрагмент будем автоматически скопирован в буфер обмена.
Извлечение текста:
- Откройте или запустите обработку. Специальная кнопка «Извлечь текст» сделает всю остальную магию — текст будет извлечен и отобразится на вашем экране, а также автоматически окажется в буфере обмена.
Универсальное применение и удобство
- Мгновенная доступность: Извлеченный текст сразу же доступен в буфере обмена.
- Интуитивная вставка: Воспользуйтесь сочетанием клавиш <Ctrl+V> для быстрой и удобной вставки текста в ваши документы, письма или презентации.
Преимущества использования инструмента:
- Локальная обработка данных - внутри локальной сети или одного персонального компьютера.
- Снижение трудозатрат и ошибок: Автоматизация процессов извлечения информации.
- Удобство и скорость: Простота в эксплуатации и мгновенный результат.
Начните использовать инструмент уже сегодня!
Пример вызова внешней компоненты
&НаКлиенте
Перем ВК;
&НаКлиенте
Процедура ПриОткрытии(Отказ)
Компонента = "AddIn.OCRimagemagick";
Попытка
Если ПодключитьВнешнююКомпоненту(Компонента) Тогда
ВК = Новый (Компонента);
Сообщить("Компонента подключена OCRimagemagick");
Иначе
Сообщить("Ошибка подключения OCRimagemagick");
КонецЕсли;
Исключение
Сообщить("Ошибка загрузки OCRimagemagick");
КонецПопытки;
КонецПроцедуры
&НаКлиенте
Процедура КомандаИзвлечь(Команда)
ИзвлеченныйТекст = ВК.ВыполнитьИзвлечение("localhost:5000");
КонецПроцедуры
Комплект поставки:
Внешняя компонента (AddIn.OCR.zip)
Архив включает в себя:
1C.AddIn.OCR.dll - библиотека внешней компоненты;
RegAddIntlb32.bat - установочный файл регистрации компоненты для приложения клиента 1С 32бит;
RegAddIntlb64.bat - установочный файл регистрации компоненты для приложения клиента 1С 64бит;
UnRegAddIntlb32.bat - установочный файл отмены регистрации компоненты для приложения клиента 1С 32бит;
UnRegAddIntlb64.bat - установочный файл отмены регистрации компоненты для приложения клиента 1С 64бит;
Извлечение текста.epf - обработка пример использования внешней компоненты.
Проект в свободном доступе
Буду рад, если вы оцените этот проект и решите присоединиться к его развитию.
Проверено на следующих конфигурациях и релизах:
- Документооборот КОРП, релизы 1.4.11.2