Конвертация PDF и распознание штрих кода на Astra Linux без регистрации и смс

13.08.24

Разработка - Инструментарий разработчика

Внешняя обработка 1С, работающая на операционной системе Linux, представляет собой инструмент для быстрой и удобной конвертации PDF-файлов в формат JPG с сохранением важной информации, такой как штрихкоды. Это решение идеально подходит для автоматизации обработки документов в логистике, складском хозяйстве, розничной торговле и других отраслях.

Скачать файл

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование По подписке [?] Купить один файл
Конвертация PDF и распознание штрих кода на Astra Linux без регистрации и смс. :
.epf 7,54Kb
0
0 Скачать (1 SM) Купить за 1 850 руб.

В рамках перехода на Линукс появилась необходимость доработать инструмент автоматической конвертации многостраничного PDF в JPG со сжатием и распознанием изображения содержащего штрихкод. В результате исследовательских приключений родилась обработка. 

Простая внешняя обработка 1С для конвертации PDF в JPG

Эта внешняя обработка предназначена для быстрой и удобной конвертации файлов формата PDF в формат JPG|PNG с автоматическим распознанием штрихкода. Доработав программу, можно получить мощный инструмент распределения сканов (электронных копий документов) в Вашей учетной системе, что делает её полезной для автоматизации обработки документов в логистике, складском хозяйстве, розничной торговле и других отраслях.

Основные функции:

  • Конвертация PDF-файлов в изображения формата JPG|PNG;
  • Распознавание штрихкодов с помощью библиотеки Zbar;

Для работы программы используются библиотеки ImageMagick и Zbar.

ImageMagick — это набор инструментов с открытым исходным кодом для работы с изображениями. Он позволяет конвертировать файлы между различными форматами, изменять их размер, добавлять водяные знаки и выполнять другие операции.

Zbar — это библиотека для распознавания штрихкодов. Она позволяет считывать различные типы штрихкодов, такие как UPC, EAN, QR-коды и другие. 

Использование этих библиотек позволяет программе быстро и эффективно конвертировать PDF-файлы в JPG|PNG, сохраняя при этом важную информацию. Это делает программу полезным инструментом для автоматизации процессов обработки документов.

Для установки библиотек использовались команды:

sudo apt-get install zbar-tools
sudo apt-get install imagemagick

Тестировалась на УПП 1.3 под Astra Linux 1.7.3 

В обработке выбираете файл PDF, последовательно выводятся сообщения содержащие штриход, сами изображения сохраняются в выбранную вами директорию. 

Проверено на следующих конфигурациях и релизах:

  • Управление производственным предприятием, редакция 1.3, релизы 1.3.231.2

pdf linux конвертация

См. также

Инструментарий разработчика Роли и права Запросы СКД Программист Руководитель проекта Платформа 1С v8.3 Управляемые формы Запросы Система компоновки данных Платные (руб)

Инструменты для разработчиков 1С 8.3: Infostart Toolkit. Автоматизация и ускорение разработки на управляемых формах. Легкость работы с 1С.

12000 руб.

02.09.2020    169315    937    403    

905

Инструментарий разработчика Чистка данных Свертка базы Инструменты администратора БД Системный администратор Программист Руководитель проекта Платформа 1С v8.3 Россия Платные (руб)

Инструмент представляет собой обработку для проведения свёртки или обрезки баз данных. Работает на ЛЮБЫХ конфигурациях (УТ, БП, ERP и т.д.). Поддерживаются серверные и файловые базы, управляемые и обычные формы. Может выполнять свертку сразу нескольких баз данных и выполнять их автоматически без непосредственного участия пользователя. Решение в Реестре отечественного ПО

8400 руб.

20.08.2024    12622    99    42    

101

Инструментарий разработчика Программист Платформа 1С v8.3 Конфигурации 1cv8 Платные (руб)

Инструмент для написания и отладки кода в режиме «1С:Предприятие». Представляет собой консоль кода с возможностью пошаговой отладки, просмотра значений переменных любых типов, использования процедур и функций, просмотра стека вызовов, вычисления произвольных выражений на встроенном языке в контексте точки останова, синтаксического контроля и остановки по ошибке. В консоли используется удобный редактор кода с подсветкой, контекстной подсказкой, возможностью вызова конструкторов запроса и форматной строки.

9360 руб.

17.05.2024    26544    90    48    

134

Пакетная печать Печатные формы Инструментарий разработчика Программист Платформа 1С v8.3 Запросы 1С:Зарплата и кадры бюджетного учреждения 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 Платные (руб)

Инструмент, позволяющий абсолютно по-новому взглянуть на процесс разработки печатных форм. Благодаря конструктору можно значительно снизить затраты времени на разработку печатных форм, повысить качество и "прозрачность" разработки, а также навести порядок в многообразии корпоративных печатных форм.

22200 руб.

06.10.2023    16834    41    15    

75

Инструменты администратора БД Инструментарий разработчика Роли и права Программист Платформа 1С v8.3 Конфигурации 1cv8 Россия Платные (руб)

Расширение позволяет без изменения кода конфигурации выполнять проверки при вводе данных, скрывать от пользователя недоступные ему данные, выполнять код в обработчиках. Не изменяет данные конфигурации, легко устанавливается практически на любую конфигурацию на управляемых формах.

15000 руб.

10.11.2023    11400    40    27    

66

SALE! %

Инструментарий разработчика Инструменты администратора БД Системный администратор Программист Платформа 1С v8.3 Управляемые формы Конфигурации 1cv8 Россия Платные (руб)

Универсальный инструмент программиста для администрирования конфигураций. Сборник наиболее часто используемых обработок под единым интерфейсом.

4800 3840 руб.

14.01.2013    190556    1150    0    

918

Инструментарий разработчика Платформа 1С v8.3 Конфигурации 1cv8 1С:ERP Управление предприятием 2 Платные (руб)

Разработка Конструктор автоматизированных рабочих мест "Конструктор АРМ" реализована в виде расширения и является универсальным инструментом для создания АРМ любой сложности в пользовательском режиме.

3600 руб.

27.12.2024    786    2    0    

4

Инструментарий разработчика Программист Платформа 1С v8.3 Конфигурации 1cv8 Россия Платные (руб)

Восстановление партий или взаиморасчетов, расчет зарплаты, пакетное формирование документов или отчетов - теперь все это стало доступнее. * Есть желание повысить скорость работы медленных алгоритмов! Но... * Нет времени думать о реализации многопоточности? * о запуске и остановке потоков? * о поддержании потоков в рабочем состоянии? * о передаче данных в потоки и как получить ответ из потока? * об организации последовательности? Тогда ЭТО - то что надо!!!

5000 руб.

07.02.2018    103934    244    100    

306
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. PerlAmutor 155 14.08.24 07:01 Сейчас в теме
Недавно тоже такую задачу реализовывал. Столкнулся с тем, что zbar довольно не стабилен, порой работает медленно. Я поэтому выбрал другую библиотеку - https://github.com/zxing-cpp/zxing-cpp
Собрал её из исходников, допилил немного ZXingReader

Столкнулся я с тем, что один и тот же штрихкод может распознаваться одной библиотекой и не распознаваться другой. Причем пустое пространство вокруг штрих кода сильно влияет на факт самого распознавания, хотя при этом его качество остается тем же. Кроме того есть ложные срабатывания, когда контрольные суммы штрих-кода дают положительный результат, но при этом информация в нем невалидная. Распознав таким образом порядка 15000 pdf документов из которых удачно распозналось лишь 60% понял, что надо переходить на QR коды, там с этим все гораздо лучше обстоит, чем с Code-128 например. Ну и чем не могут похвастаться такие сканеры штрих кодов - они не имеют компьютерного зрения, чтобы сначала вычислитель "области интереса" для распознавания. В результате они сканируют изображения с огромным разрешением по чем зря, где штрих-кодов вообще нет.
Ну и вопрос с множественными штрих-кодами (QR, Bar-Code, DataMatrix) в одном PDF файле, которые могут нести полезную информацию, а могут и не нести - остается открытым.

Ну и очень важный момент - изображение штрих-кода еще надо предварительно обработать (grayscale, dithering, upscale, rotate и т.д.), причем параметры эти надо подбирать динамически в зависимости от размера штрих-кода и т.д., т.к. иногда он распознается при уменьшении размеров, а иногда наоборот при увеличении на 1000%.
2. akR00b 24 14.08.24 08:09 Сейчас в теме
(1) Полностью согласен, под наши нужды Zbar 90% +- распознает, но и у нас штрихкод не маленький, частая проблема это качество печати и качество самого изображения для распознания. За zxing-cpp спасибо, будем посмотреть, было бы здоров почитать статью по поводу этого инструмента, так как на самом деле мало информации для любителей работать на LINUX.
3. starik-2005 3097 14.08.24 14:47 Сейчас в теме
gocr вполне себе распознавал 10 лет назад разные ШК, уже тогда он умел в XML это все красиво раскладывать.
По поводу PDF, то есть куча либ для питона, которые разбирают PDF на участки картинок и текстов. Лучше было бы сервис сделать на питоне, а к нему уже запросы с клиентов. И никаких лишних телодвижений.
4. akR00b 24 14.08.24 15:41 Сейчас в теме
(3) Не все могут позволить стучаться на чужие сервисы.
5. starik-2005 3097 14.08.24 17:50 Сейчас в теме
(4)
на чужие сервисы
Не на чужие, а на свои. Прям на локалхосте сервака сервис запускается и висит на порту, например, 8888, где слушает посты с ПДФками. Прилетела ПДФка, а он в ответ массив картинок и ШК в джисончике.

Я на днях текст выдирал из ПДФки - 20 минут гугла заняло. В итоге скармливаешь ему ПДФ, а он в ответ слова и выражения, в нем указанные. В сервис обернуть - еще 10 минут.

Типа того: https://infostart.ru/1c/articles/1543746/
6. akR00b 24 15.08.24 08:54 Сейчас в теме
(5) прочитал сервер как сервис, пардон) да этот подход возможен, он прост в организации и лаконичен,но из за того что очень много приходится распознавать и передавать на сервер большие по 200/300 мб PDF, лучше останемся на клиенте ;)
Оставьте свое сообщение