Потоковое сканирование и распознавание (api_ocr)

24.02.21

Интеграция - Файловый обмен (TXT, XML, DBF), FTP

Практика использования инструмента распознавания от google tesseract.

Файлы

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование Скачано Купить файл
Потоковое сканирование и распознавание (api_ocr):
.cf 8,37Mb
12 1 850 руб. Купить

Подписка PRO — скачивайте любые файлы со скидкой до 85% из Базы знаний

Оформите подписку на компанию для решения рабочих задач

Оформить подписку и скачать решение со скидкой

Цель: Автоматизировать работу по обработке сканов

Дано: Существует файловый ресурс для сканирования и хранения счетов.

Задачи:

  1. Проверять правильность указания Р/С в платежных документах относительно контрагентов и выставленных счетов
  2. Необходимо настроить инструмент для автоматического "подшития" скана к документу 1С по входящему номеру
  3. Ускорить создание документов, номенклатуры
  4. Ведение номенклатуры поставщика

Условия для начала работы

  1. python 3.8 & higer 
  2. tesseract-ocr-setup-3.05.01
    1. git
    2. win..exe
  3. 1С Предприятие. (Разработка и эксплуатация велась на серверной версии) 1С:Предприятие 8.3 (8.3.17.1851)

 

 

Файлы типов pdf, jpg расположенные в каталогах сканируются py. скриптом, после чего текстовые данные попадают в аргегатор данных. Агрегатор,  периодически анализирует содержание текстовых данных и пытается их структурировать.

  1. список файлов
  2. сырой текст
  3. текст с параметрами (координаты, только символы или цифры) 

Справочник “файлы” (меню “Содержание файл”)

Например: pdf файл содержит УПД от клиента, после того, как данные попали в агрегатор, регламентное задание по очереди запускает очередь модулей анализа, в которых производится анализ всех блоков текста и находит несколько последовательностей из 10 цифр, по которой можно определить ИНН контрагента. К записи файла, помимо текстовой информации подкрепляется структурированные поля, такие как “Вид Документа” или “Контрагенты”.

Для ускорения анализа все файлы обрабатываются в параллельном режиме

Модуль анализа “контрагенты”


api результат get - запроса после обработки

 

 

БСП взято за основание решение.

Примеры кода справочника "Модули анализа"

Тип документа:

//#_Переменные модуля
//ИсходныйТекст - Содержимое файла
//СообщениеМодуля - строка неограниченной длинны, добавлять в конец строки
//РезультатАлгоритма - строка неограниченной длинны
//РезультатАлгоритма = ИсходныйТекст; //пример простого копирования

Если Найти(врег(ИсходныйТекст),"ТОРГ-12") Тогда
	РезультатАлгоритма	=  "ТОРГ-12";
Конецесли;

Если Найти(ИсходныйТекст,"Счет-фактура") Тогда
	РезультатАлгоритма	=  "Счет-фактура";
Конецесли;

 

Расчетные счета:

ТаблицаПолей = _МодульОбработки.ВернутьТаблицуПоЗначениям(ИсходныйТекст);
	
//Поиск р/с
МассивСтрок = ТаблицаПолей.НайтиСтроки(Новый Структура("ТолькоЦифры,ДлиннаПоля",Истина,20));
	
МассивЗначений = ТаблицаПолей.Скопировать(МассивСтрок,"ЗначениеПоля").ВыгрузитьКолонку("ЗначениеПоля");		
	
РезультатАлгоритма = _МодульОбработки.РазвернутьМассивВСтроку(МассивЗначений);

Дополнительно:

  • Уважаемые пользователи проект в стадии активного использования поэтому планирую создать отдельную ветку на гите куда буду скидывать наработанные модули.
  • А пока осваиваю регулярные выражения. 
  • Анализ листа можно производить с учетом координат слов/предложений, т.к. эти данные так же собираются от tesseract.

 

Интересное из последних работ:

api_query

Готовое решение

Распознавание и загрузка сканов в 1С

Инструмент, который превращает скан накладной, счета, УПД или Excel-файл в готовый документ в 1С. За считанные секунды. Без ручного ввода. Без ошибок. С распознаванием даже нечётких фото.


Вступайте в нашу телеграмм-группу Инфостарт

См. также

SALE! 10%

Перенос данных 1C Файловый обмен (TXT, XML, DBF), FTP Системный администратор Программист 1С v8.3 1С:Розница 2 1С:Управление нашей фирмой 1.6 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 1С:Розница 3.0 Россия Платные (руб)

Правила в универсальном формате обмена для ERP 2.5, КА 2.5, УТ 11.5, БП 3.0, Розница, УНФ, для последних версий конфигураций. Ссылки на другие конфигурации в описании публикации. Правила совместимы со всеми другими версиями конфигураций новыми и старыми, поддерживающими обмен и синхронизацию в формате EnterpriseData. Не требуется синхронного обновления правил после обновления другой конфигурации, участвующей в обмене. Типовой обмен через планы обмена кнопкой Синхронизация вручную или автоматически по расписанию, или вручную обработкой.

27660 руб.

12.06.2017    152916    895    302    

463

SALE! 10%

Перенос данных 1C Файловый обмен (TXT, XML, DBF), FTP Программист 1С v8.3 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х Россия Платные (руб)

Перенос данных из ERP в БП 3 | из КА 2 в БП 3 | из УТ 11 в БП 3 | из ЕРП в БП 3 | Сэкономьте время - используйте готовое решение для перехода! | Перенос разработан в формате КД 2 (правила конвертации данных) | Переносятся все возможные виды документов, начальных остатков и нормативно-справочная информация| Можно опционально выгружать каждую пару "номенклатура+характеристика" как отдельную номенклатуру | Есть выгрузка настроек счетов учета и зарплатных данных из ERP / КА 2 | Можно проверить на вашем сервере перед покупкой

55778 50200 руб.

15.04.2019    79023    213    163    

152

SALE! 10%

Перенос данных 1C Файловый обмен (TXT, XML, DBF), FTP Системный администратор Программист 1С v8.3 1С:Комплексная автоматизация 1.х 1С:Управление производственным предприятием 1С:Бухгалтерия 3.0 Россия Бухгалтерский учет Платные (руб)

Перенос данных из 1С:Управление производственным предприятием 1.3 в 1С:Бухгалтерия предприятия 3.0 с помощью правил обмена | Можно выполнить переход с УПП на БП 3 или запускать выгрузку данных за выбранный период времени | Переносятся документы, начальные остатки и вся справочная информация | Есть фильтр по организации и множество других параметров выгрузки | Поддерживается несколько сценариев работы: как первичный полный перенос, так и перенос только новых документов | Перенос данных возможен в "1С: Бухгалтерия 3.0" версии ПРОФ, КОРП или базовую | Переход с "1С: УПП1.3" / "1С:КА 1.1" на "1С:БП3.0" с помощью правил конвертации будет максимально комфортным! | Можно бесплатно проверить перенос на вашем сервере!

48278 43450 руб.

25.02.2015    178179    328    275    

396

SALE! 10%

Перенос данных 1C Файловый обмен (TXT, XML, DBF), FTP Программист 1С v8.3 1С:ERP Управление предприятием 2 1С:Комплексная автоматизация 2.х 1С:Зарплата и Управление Персоналом 3.x Россия Бухгалтерский учет Управленческий учет Платные (руб)

Перенос данных из ERP в ЗУП 3 | из КА 2 в ЗУП | Готовые правила конвертации данных (КД 2) для переноса остатков, документов с движениями и справочной информации 3 | Есть перенос начальной задолженности по зарплате и начальной штатной расстановки на выбранную дату | Обороты за прошлые годы (данные для расчета среднего) переносятся свернуто в документ "Перенос данных" | Есть фильтр по организациям | Документы за текущий период переносятся сразу с движениями, поэтому не потребуется делать перерасчеты | Перенос можно проверить перед покупкой, обращайтесь!

53111 47800 руб.

03.12.2020    42054    120    75    

114

SALE! 10%

Перенос данных 1C Файловый обмен (TXT, XML, DBF), FTP Системный администратор Программист 1С v8.3 1С:Управление производственным предприятием 1С:Бухгалтерия 3.0 Россия Бухгалтерский учет Управленческий учет Платные (руб)

Перенос данных из 1С:Управление производственным предприятием 1.3 в 1С:Бухгалтерия предприятия 3.0 с помощью правил обмена. Переносятся остатки, документы (обороты за период), справочная информация. Правила проверены на конфигурациях УПП 1.3 (1.3.255.x) и БП 3.0 (3.0.183.x). Правила подходят для версии ПРОФ и КОРП.

38000 34200 руб.

15.12.2021    29740    214    58    

159

SALE! 10%

Перенос данных 1C Файловый обмен (TXT, XML, DBF), FTP Системный администратор Программист 1С v8.3 Оперативный учет 1С:Управление торговлей 10 Россия Управленческий учет Платные (руб)

Перенос данных из 1С:Управление торговлей 10.3 в 1С:Управление торговлей 11.5 с помощью правил обмена. Переносятся остатки, документы (обороты за период), справочная информация. Правила проверены на конфигурациях УТ 10.3 (10.3.88.x) и УТ 11.5 (11.5.24.x).

38000 34200 руб.

23.07.2020    61757    290    81    

230

Операции по ВЭД Файловый обмен (TXT, XML, DBF), FTP Программист Бухгалтер 1С v8.3 Бухгалтерский учет 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 Россия Бухгалтерский учет Платные (руб)

Федеральная таможенная служба России давно поддерживает унифицированный формат электронных документов для обмена с информационными системами предприятий. xmlns="urn:customs.ru:Information:ExchangeDocuments:". Структура, утвержденная комиссией Таможенного союза. Осталось только сделать загрузку в 1С из этого формата. На выходе - два документа ГТД по импорту и Поступление (акты, накладные) Обработка актуализирована на начало 2025 года

4800 руб.

09.08.2016    88975    333    378    

92

SALE! 10%

Перенос данных 1C Файловый обмен (TXT, XML, DBF), FTP Программист 1С v8.3 Сложные периодические расчеты 1С:Комплексная автоматизация 1.х 1С:Управление производственным предприятием 1С:Зарплата и Управление Персоналом 3.x Россия Бухгалтерский учет Платные (руб)

Правила переноса кадровых и расчетных данных и справочной информации из "1С:УПП1.3" или "1С:КА 1.1" в "1С:ЗУП 3.1 | Разработан в формате КД 2 (правила конвертации данных) | При выгрузке есть фильтр по организациям | Обновляется при выходе новых релизов 1С | Развитие алгоритмов | Расчетные документы переносятся в документ "Перенос данных" | Создаются документы "Начальная штатная расстановка" и "Начальная задолженность по зарплате", переносятся кадровые документы

55778 50200 руб.

29.10.2018    59157    68    121    

67
Для отправки сообщения требуется регистрация/авторизация