Потоковое сканирование и распознавание (api_ocr)

24.02.21

Интеграция - Файловый обмен (TXT, XML, DBF), FTP

Практика использования инструмента распознавания от google tesseract.

Скачать файл

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование По подписке [?] Купить один файл
Потоковое сканирование и распознавание (api_ocr):
.cf 8,37Mb
12
12 Скачать (1 SM) Купить за 1 850 руб.

Цель: Автоматизировать работу по обработке сканов

Дано: Существует файловый ресурс для сканирования и хранения счетов.

Задачи:

  1. Проверять правильность указания Р/С в платежных документах относительно контрагентов и выставленных счетов
  2. Необходимо настроить инструмент для автоматического "подшития" скана к документу 1С по входящему номеру
  3. Ускорить создание документов, номенклатуры
  4. Ведение номенклатуры поставщика

Условия для начала работы

  1. python 3.8 & higer 
  2. tesseract-ocr-setup-3.05.01
    1. git
    2. win..exe
  3. 1С Предприятие. (Разработка и эксплуатация велась на серверной версии) 1С:Предприятие 8.3 (8.3.17.1851)

 

 

Файлы типов pdf, jpg расположенные в каталогах сканируются py. скриптом, после чего текстовые данные попадают в аргегатор данных. Агрегатор,  периодически анализирует содержание текстовых данных и пытается их структурировать.

  1. список файлов
  2. сырой текст
  3. текст с параметрами (координаты, только символы или цифры) 

Справочник “файлы” (меню “Содержание файл”)

Например: pdf файл содержит УПД от клиента, после того, как данные попали в агрегатор, регламентное задание по очереди запускает очередь модулей анализа, в которых производится анализ всех блоков текста и находит несколько последовательностей из 10 цифр, по которой можно определить ИНН контрагента. К записи файла, помимо текстовой информации подкрепляется структурированные поля, такие как “Вид Документа” или “Контрагенты”.

Для ускорения анализа все файлы обрабатываются в параллельном режиме

Модуль анализа “контрагенты”


api результат get - запроса после обработки

 

 

БСП взято за основание решение.

Примеры кода справочника "Модули анализа"

Тип документа:

//#_Переменные модуля
//ИсходныйТекст - Содержимое файла
//СообщениеМодуля - строка неограниченной длинны, добавлять в конец строки
//РезультатАлгоритма - строка неограниченной длинны
//РезультатАлгоритма = ИсходныйТекст; //пример простого копирования

Если Найти(врег(ИсходныйТекст),"ТОРГ-12") Тогда
	РезультатАлгоритма	=  "ТОРГ-12";
Конецесли;

Если Найти(ИсходныйТекст,"Счет-фактура") Тогда
	РезультатАлгоритма	=  "Счет-фактура";
Конецесли;

 

Расчетные счета:

ТаблицаПолей = _МодульОбработки.ВернутьТаблицуПоЗначениям(ИсходныйТекст);
	
//Поиск р/с
МассивСтрок = ТаблицаПолей.НайтиСтроки(Новый Структура("ТолькоЦифры,ДлиннаПоля",Истина,20));
	
МассивЗначений = ТаблицаПолей.Скопировать(МассивСтрок,"ЗначениеПоля").ВыгрузитьКолонку("ЗначениеПоля");		
	
РезультатАлгоритма = _МодульОбработки.РазвернутьМассивВСтроку(МассивЗначений);

Дополнительно:

  • Уважаемые пользователи проект в стадии активного использования поэтому планирую создать отдельную ветку на гите куда буду скидывать наработанные модули.
  • А пока осваиваю регулярные выражения. 
  • Анализ листа можно производить с учетом координат слов/предложений, т.к. эти данные так же собираются от tesseract.

 

Интересное из последних работ:

api_query

См. также

SALE! 20%

Перенос данных 1C Файловый обмен (TXT, XML, DBF), FTP Системный администратор Программист Платформа 1С v8.3 1С:Розница 2 1С:Управление нашей фирмой 1.6 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 1С:Розница 3.0 Россия Платные (руб)

Правила в универсальном формате обмена для ERP 2.5, КА 2.5, УТ 11.5, БП 3.0, Розница, УНФ, для последних версий конфигураций. Ссылки на другие конфигурации в описании публикации. Правила совместимы со всеми другими версиями конфигураций новыми и старыми, поддерживающими обмен и синхронизацию в формате EnterpriseData. Не требуется синхронного обновления правил после обновления другой конфигурации, участвующей в обмене. Типовой обмен через планы обмена кнопкой Синхронизация вручную или автоматически по расписанию, или вручную обработкой.

27660 руб.

12.06.2017    144338    837    297    

432

Перенос данных 1C Файловый обмен (TXT, XML, DBF), FTP Системный администратор Программист Платформа 1С v8.3 Оперативный учет 1С:Управление торговлей 10 Россия Управленческий учет Платные (руб)

Перенос данных из 1С:Управление торговлей 10.3 в 1С:Управление торговлей 11.5 с помощью правил обмена. Переносятся остатки, документы (обороты за период), справочная информация. Правила проверены на конфигурациях УТ 10.3 (10.3.88.x) и УТ 11.5 (11.5.20.x), также подходят для релиза 11.5 (11.5.19.x).

35000 руб.

23.07.2020    54581    242    73    

196

SALE! 10%

Перенос данных 1C Файловый обмен (TXT, XML, DBF), FTP Программист Платформа 1С v8.3 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х Россия Платные (руб)

Перенос данных из ERP в БП 3 | из КА 2 в БП 3 | из УТ 11 в БП 3 | из ЕРП в БП 3 | Сэкономьте время - используйте готовое решение для перехода! | Перенос разработан в формате КД 2 (правила конвертации данных) | Переносятся все возможные виды документов, начальных остатков и нормативно-справочная информация| Можно опционально выгружать каждую пару "номенклатура+характеристика" как отдельную номенклатуру | Есть выгрузка настроек счетов учета и зарплатных данных из ERP / КА 2 | Можно проверить на вашем сервере перед покупкой

55778 50200 руб.

15.04.2019    73369    193    153    

130

SALE! 10%

Перенос данных 1C Файловый обмен (TXT, XML, DBF), FTP Программист Платформа 1С v8.3 1С:ERP Управление предприятием 2 1С:Комплексная автоматизация 2.х 1С:Зарплата и Управление Персоналом 3.x Россия Бухгалтерский учет Управленческий учет Платные (руб)

Перенос данных из ERP в ЗУП 3 | из КА 2 в ЗУП | Готовые правила конвертации данных (КД 2) для переноса остатков, документов с движениями и справочной информации 3 | Есть перенос начальной задолженности по зарплате и начальной штатной расстановки на выбранную дату | Обороты за прошлые годы (данные для расчета среднего) переносятся свернуто в документ "Перенос данных" | Есть фильтр по организациям | Документы за текущий период переносятся сразу с движениями, поэтому не потребуется делать перерасчеты | Перенос можно проверить перед покупкой, обращайтесь!

53111 47800 руб.

03.12.2020    37714    103    69    

98

SALE! 10%

Перенос данных 1C Взаиморасчеты Оптовая торговля Логистика, склад и ТМЦ Файловый обмен (TXT, XML, DBF), FTP Системный администратор Программист Платформа 1С v8.3 1С:Управление торговлей 10 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х Россия Управленческий учет Платные (руб)

Можно проверить до покупки, оставьте заявку! Воспользовались более 268 компаний! Перенос данных из УТ 10.3 в УТ 11 | из УТ 10.3 в КА 2 | из УТ 10.3 в ERP. Предлагаем качественное и проверенное временем решение для перехода с УТ 10.3. Можно перенести начальные остатки, нормативно-справочную информацию и все возможные документы. При выгрузке можно установить отбор по периоду, организациям и складам. При выходе новых релизов конфигураций 1C оперативно выпускаем обновление переноса данных.

55778 50200 руб.

24.04.2015    196520    157    244    

287

Перенос данных 1C Файловый обмен (TXT, XML, DBF), FTP Системный администратор Программист Платформа 1С v8.3 1С:Управление производственным предприятием 1С:Бухгалтерия 3.0 Россия Бухгалтерский учет Управленческий учет Платные (руб)

Перенос данных из 1С:Управление производственным предприятием 1.3 в 1С:Бухгалтерия предприятия 3.0 с помощью правил обмена. Переносятся остатки, документы (обороты за период), справочная информация. Правила проверены на конфигурациях УПП 1.3 (1.3.240.x) и БП 3.0 (3.0.169.x). Правила подходят для версии ПРОФ и КОРП.

35000 руб.

15.12.2021    25354    177    52    

135

SALE! 10%

Перенос данных 1C Файловый обмен (TXT, XML, DBF), FTP Системный администратор Программист Платформа 1С v8.3 1С:Комплексная автоматизация 1.х 1С:Управление производственным предприятием 1С:Бухгалтерия 3.0 Россия Бухгалтерский учет Платные (руб)

Перенос данных из 1С:Управление производственным предприятием 1.3 в 1С:Бухгалтерия предприятия 3.0 с помощью правил обмена | Можно выполнить переход с УПП на БП 3 или запускать выгрузку данных за выбранный период времени | Переносятся документы, начальные остатки и вся справочная информация | Есть фильтр по организации и множество других параметров выгрузки | Поддерживается несколько сценариев работы: как первичный полный перенос, так и перенос только новых документов | Перенос данных возможен в "1С: Бухгалтерия 3.0" версии ПРОФ, КОРП или базовую | Переход с "1С: УПП1.3" / "1С:КА 1.1" на "1С:БП3.0" с помощью правил конвертации будет максимально комфортным! | Можно бесплатно проверить перенос на вашем сервере!

48278 43450 руб.

25.02.2015    172529    309    260    

385

Перенос данных 1C Файловый обмен (TXT, XML, DBF), FTP Программист Платформа 1С v8.3 1С:Управление производственным предприятием 1С:ERP Управление предприятием 2 Бухгалтерский учет Управленческий учет Платные (руб)

Перенос данных из 1С:Управление производственным предприятием 1.3 в 1С:ERP Управление предприятием 2.5 и 1С:Комплексную автоматизацию 2.5 с помощью правил обмена. Переносятся остатки, документы (обороты за период), справочная информация. Правила проверены на конфигурациях УПП 1.3 (1.3.240.x), ERP 2.5 (2.5.20.x), КА 2.5 (2.5.20.x), также подходят для релиза ERP 2.5 (2.5.19.x), КА 2.5 (2.5.19.x).

35000 руб.

24.06.2020    64453    79    27    

91
Оставьте свое сообщение