Потоковое сканирование и распознавание (api_ocr)

24.02.21

Интеграция - Файловый обмен (TXT, XML, DBF), FTP

Практика использования инструмента распознавания от google tesseract.

Файлы

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование Скачано Купить файл
Потоковое сканирование и распознавание (api_ocr):
.cf 8,37Mb
13 2 500 руб. Купить

Подписка PRO — скачивайте любые файлы со скидкой до 85% из Базы знаний

Оформите подписку на компанию для решения рабочих задач

Оформить подписку и скачать решение со скидкой

Вы можете заказать платную доработку или адаптацию этой разработки под вашу конфигурацию на «Бирже заказов».

  • 0% комиссии — оплата напрямую исполнителю;
  • Исполнители любого масштаба — от отдельных специалистов до команд под проект;
  • Прямой обмен контактами между заказчиком и исполнителем;
  • Безопасная сделка — при необходимости;
  • Рейтинги, кейсы и прозрачная система откликов.

Цель: Автоматизировать работу по обработке сканов

Дано: Существует файловый ресурс для сканирования и хранения счетов.

Задачи:

  1. Проверять правильность указания Р/С в платежных документах относительно контрагентов и выставленных счетов
  2. Необходимо настроить инструмент для автоматического "подшития" скана к документу 1С по входящему номеру
  3. Ускорить создание документов, номенклатуры
  4. Ведение номенклатуры поставщика

Условия для начала работы

  1. python 3.8 & higer 
  2. tesseract-ocr-setup-3.05.01
    1. git
    2. win..exe
  3. 1С Предприятие. (Разработка и эксплуатация велась на серверной версии) 1С:Предприятие 8.3 (8.3.17.1851)

 

 

Файлы типов pdf, jpg расположенные в каталогах сканируются py. скриптом, после чего текстовые данные попадают в аргегатор данных. Агрегатор,  периодически анализирует содержание текстовых данных и пытается их структурировать.

  1. список файлов
  2. сырой текст
  3. текст с параметрами (координаты, только символы или цифры) 

Справочник “файлы” (меню “Содержание файл”)

Например: pdf файл содержит УПД от клиента, после того, как данные попали в агрегатор, регламентное задание по очереди запускает очередь модулей анализа, в которых производится анализ всех блоков текста и находит несколько последовательностей из 10 цифр, по которой можно определить ИНН контрагента. К записи файла, помимо текстовой информации подкрепляется структурированные поля, такие как “Вид Документа” или “Контрагенты”.

Для ускорения анализа все файлы обрабатываются в параллельном режиме

Модуль анализа “контрагенты”


api результат get - запроса после обработки

 

 

БСП взято за основание решение.

Примеры кода справочника "Модули анализа"

Тип документа:

//#_Переменные модуля
//ИсходныйТекст - Содержимое файла
//СообщениеМодуля - строка неограниченной длинны, добавлять в конец строки
//РезультатАлгоритма - строка неограниченной длинны
//РезультатАлгоритма = ИсходныйТекст; //пример простого копирования

Если Найти(врег(ИсходныйТекст),"ТОРГ-12") Тогда
	РезультатАлгоритма	=  "ТОРГ-12";
Конецесли;

Если Найти(ИсходныйТекст,"Счет-фактура") Тогда
	РезультатАлгоритма	=  "Счет-фактура";
Конецесли;

 

Расчетные счета:

ТаблицаПолей = _МодульОбработки.ВернутьТаблицуПоЗначениям(ИсходныйТекст);
	
//Поиск р/с
МассивСтрок = ТаблицаПолей.НайтиСтроки(Новый Структура("ТолькоЦифры,ДлиннаПоля",Истина,20));
	
МассивЗначений = ТаблицаПолей.Скопировать(МассивСтрок,"ЗначениеПоля").ВыгрузитьКолонку("ЗначениеПоля");		
	
РезультатАлгоритма = _МодульОбработки.РазвернутьМассивВСтроку(МассивЗначений);

Дополнительно:

  • Уважаемые пользователи проект в стадии активного использования поэтому планирую создать отдельную ветку на гите куда буду скидывать наработанные модули.
  • А пока осваиваю регулярные выражения. 
  • Анализ листа можно производить с учетом координат слов/предложений, т.к. эти данные так же собираются от tesseract.

 

Интересное из последних работ:

api_query

Распознавание и загрузка сканов в 1С

Решение «Распознавание и загрузка сканов в 1С» — интеллектуальный инструмент, превращающий сканы накладных, счетов, УПД или Excel-файлов в готовые документы 1С. Без ручного ввода и ошибок — с распознаванием даже нечетких фото. Оптимизируйте документооборот и автоматизируйте рутину с помощью ИИ-распознавания.

Вступайте в нашу телеграмм-группу Инфостарт

См. также

SALE! 20%

Перенос данных 1C Файловый обмен (TXT, XML, DBF), FTP Системный администратор Программист 1С:Предприятие 8 1С:Розница 2 1С:Управление нашей фирмой 1.6 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 1С:Розница 3.0 Россия Платные (руб)

Правила в универсальном формате обмена для ERP 2.5, КА 2.5, УТ 11.5, БП 3.0, Розница, УНФ, для последних версий конфигураций. Ссылки на другие конфигурации в описании публикации. Правила совместимы со всеми другими версиями конфигураций новыми и старыми, поддерживающими обмен и синхронизацию в формате EnterpriseData. Не требуется синхронного обновления правил после обновления другой конфигурации, участвующей в обмене. Типовой обмен через планы обмена кнопкой Синхронизация вручную или автоматически по расписанию, или вручную обработкой.

27633 руб.

12.06.2017    160896    969    321    

482

SALE! 10%

Перенос данных 1C Файловый обмен (TXT, XML, DBF), FTP Системный администратор Программист 1С:Предприятие 8 1С:Управление производственным предприятием 1С:Бухгалтерия 3.0 Россия Бухгалтерский учет Управленческий учет Платные (руб)

Переносите справочную информацию, остатки и документы из УПП 1.3 в Бухгалтерию 3.0 с помощью готовых правил. Переносится более 50 видов документов. Простой интерфейс и понятные настройки.

42000 37800 руб.

15.12.2021    34264    259    64    

195

Перенос данных 1C Файловый обмен (TXT, XML, DBF), FTP Системный администратор Программист 1С:Предприятие 8 1С:Комплексная автоматизация 1.х 1С:Управление производственным предприятием 1С:Бухгалтерия 3.0 Россия Бухгалтерский учет Платные (руб)

Перенос данных из 1С:Управление производственным предприятием 1.3 в 1С:Бухгалтерия предприятия 3.0 с помощью правил обмена | Можно выполнить переход с УПП на БП 3 или запускать выгрузку данных за выбранный период времени | Переносятся документы, начальные остатки и вся справочная информация | Есть фильтр по организации и множество других параметров выгрузки | Поддерживается несколько сценариев работы: как первичный полный перенос, так и перенос только новых документов | Перенос данных возможен в "1С: Бухгалтерия 3.0" версии ПРОФ, КОРП или базовую | Переход с "1С: УПП1.3" / "1С:КА 1.1" на "1С:БП3.0" с помощью правил конвертации будет максимально комфортным! | Можно бесплатно проверить перенос на вашем сервере!

50050 руб.

25.02.2015    188363    360    289    

418

Перенос данных 1C Файловый обмен (TXT, XML, DBF), FTP Системный администратор Программист Бухгалтер 1С:Предприятие 8 1С:Бухгалтерия 2.0 1С:Бухгалтерия 3.0 Россия Бухгалтерский учет Налоговый учет Платные (руб)

Перенос данных из БП 2 в БП 3 готовые правила конвертации данных (КД 2), сэкономьте свое время! | Выполнить переход с БП 2 на БП 3 в ситуациях, когда простым обновлением перейти не получается | Переносится вся справочная информация, документы за выбранный период, а также начальные остатки на выбранную дату (то есть можно еще и свертку базы сделать при переносе) | Есть фильтр по организациям при выгрузке данных | Перенос можно проверить перед покупкой прямо на вашем сервере! Обращайтесь за проверкой!

50600 руб.

21.05.2019    58156    81    131    

73

Перенос данных 1C Файловый обмен (TXT, XML, DBF), FTP Программист 1С:Предприятие 8 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х Россия Платные (руб)

Перенос данных из ERP в БП 3 | из КА 2 в БП 3 | из УТ 11 в БП 3 | из ЕРП в БП 3 | Сэкономьте время - используйте готовое решение для перехода! | Перенос разработан в формате КД 2 (правила конвертации данных) | Переносятся все возможные виды документов, начальных остатков и нормативно-справочная информация| Можно опционально выгружать каждую пару "номенклатура+характеристика" как отдельную номенклатуру | Есть выгрузка настроек счетов учета и зарплатных данных из ERP / КА 2 | Можно проверить на вашем сервере перед покупкой

58000 руб.

15.04.2019    84179    225    175    

162

Перенос данных 1C Файловый обмен (TXT, XML, DBF), FTP Программист 1С:Предприятие 8 1С:Комплексная автоматизация 1.х 1С:Управление производственным предприятием 1С:Зарплата и Управление Персоналом 3.x Россия Бухгалтерский учет Платные (руб)

Правила переноса кадровых и расчетных данных и справочной информации из "1С:УПП1.3" или "1С:КА 1.1" в "1С:ЗУП 3.1 | Разработан в формате КД 2 (правила конвертации данных) | При выгрузке есть фильтр по организациям | Обновляется при выходе новых релизов 1С | Развитие алгоритмов | Расчетные документы переносятся в документ "Перенос данных" | Создаются документы "Начальная штатная расстановка" и "Начальная задолженность по зарплате", переносятся кадровые документы

58000 руб.

29.10.2018    62857    82    132    

81

Внешние источники данных Кадровый учет Файловый обмен (TXT, XML, DBF), FTP Перенос данных 1C Программист 1С:Предприятие 8 1С:Зарплата и кадры государственного учреждения 3 Государственные, бюджетные структуры Россия Бухгалтерский учет Бюджетный учет Платные (руб)

Обработка позволяет перенести кадровую информацию и данные по заработной плате, фактическим удержаниям, НДФЛ, вычетам, страховым взносам из базы Парус 10 учреждений (далее Парус) в конфигурацию 1С:Зарплата и кадры государственного учреждения ред. 3 (далее 1С) и начать с ней работать с любого месяца года.

85400 руб.

05.10.2022    13474    15    8    

16
Для отправки сообщения требуется регистрация/авторизация