Расширение для загрузки в 1С сканов документов, pdf файлов, распознанных с помощью OCR

11.01.22

Функциональные - Документооборот и делопроизводство (СЭД)

Подсистема, предназначенная для автоматического разбора распознанного файла, извлечение из него полезной информации и загрузки данных в 1С.

Скачать файл

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование Бесплатно
Расширение для загрузки в 1С сканов документов, pdf файлов, распознанных с помощью OCR:
.cfe 758,14Kb
262
262 Скачать бесплатно

Предисловие

Данную подсистему сделал в свободное время, так как была интересна тема распознавания изображений. Потом, в компании, в которой работаю, оценили разработку и успешно используют в загрузке специфичных и сложных для ручной обработки документов от вендера.

Выкладываю с одной целью - понять, актуально ли данное решение для других компаний, так как сейчас набирает популярность ЭДО (хотя на данном этапе у него много минусов). Если актуально, то собрать пожелания, идеи и сделать продукт, который полезен и выгоден для пользователя. 

PS. Данная штука не особо никому не нужна. Выложил всё в открытый доступ. Всё предоставляется "как есть".

Требования

Платформа не менее 8.3.12, режим совместимости не менее 8.3.12. Система Windows.

Описание

Программа использует различные варианты распознавания. Tesseract, ABBY FineReader, ABBY Hot Folder, ABBY Recognition Server, ABBYY Cloud OCR SDK. Выбор продукта зависит от количество документов и удобства использования в целом. Выбор пал именно на продукты ABBY, так как именно они выдают результат с наиболее приемлемым качеством распознавания и, самое важное, сохраняют структуру исходного файла. 

По сути, данная разработка - парсер, которая выуживает определённым способом данные из распознанного файла данные, структурирует их, и по настройкам пользователя загружает в 1с. Более того, позволяет пользователю расширять список документов для автоматического распознавания, что позволяет загружать не только какие-то типовые формы, но и произвольные (которые соответствуют определенным критериям, о которых ниже), притом именно в те документы в 1с, которые нужны пользователю, и так, как это нужно именно пользователю, а не как предусмотрел разработчик.

Механизм работы следующий. Файл преобразуется в htm файл (или xml, при работе с облаком). Если блок данных распознаётся как таблица, то программа пытается получить шапку таблицы и на основании этих данных, пытается соотнести информацию в ячейках к конкретной колонке в шапке. Поэтому:

Ограничение №1: Шапка таблицы должна быть только горизонтальная

Ограничение №2: Строки таблицы не должны быть многоуровневыми

Ограничение №3: Таблица должна распознаться, следовательно в исходном документе должна быть явно выделена

Если блок не таблица, то программа считает, что это информации относящиеся к шапке документа и пытается выделить из него полезную информацию, такие как поставщик, покупатель, номер, дата и прочее.

После программа пытается полученный массив полезных блоков информации логически разделить на документы, так как один документ может быть разбит на несколько файлов, так и в одном файле может содержаться несколько документов.

Пользователю выводится список файлов, на каждый вид документа есть своя настройка загрузки. По этой настройке данные загружаются в 1с. 

Порядок установки, работы и нюансы более подробно в документации.

Пример

Счет из Демо-базы УТ

При распознавании данного файла получим следующий результат.

Загрузим в «Приобретение услуг и прочих активов». Сделаем следующие настройки.

Создадим документ.

Осталось проверить корректность загрузки и заполнить требуемые поля.

OCR распознавание загрузка расширение

См. также

Документооборот и делопроизводство (СЭД) Типовые Бухгалтер Пользователь Руководитель проекта Платформа 1С v8.3 Управленческий учет Платные (руб)

Организуйте правильный оборот документов на вашем предприятии в 1С. Ведение учета и хранения документов. Управление потоками документации между подразделениями. Работа с договорами в компании. Автоматизация процессов подготовки, согласования и подписания документов. Сократите время и объем ошибок с 1С:ДО!

48500 руб.

19.02.2016    108744    126    5    

98

SALE! 30%

Загрузка и выгрузка в Excel Документооборот и делопроизводство (СЭД) Учет документов Распознавание документов и образов Бухгалтер Пользователь Управляемые формы 1С:Комплексная автоматизация 1.х 1С:Бухгалтерия 2.0 1С:Управление торговлей 10 1С:Розница 2 1С:Управление производственным предприятием 1С:Управление нашей фирмой 1.6 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Управление холдингом 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 Бухгалтерский учет Управленческий учет Платные (руб)

Универсальная программа для распознавания сканов или фото товарных документов в 1С. Не требует указания параметров и предварительной настройки. Просто выбираете файл (PDF, JPG, DOC, XLS, HTML) выбираете документ 1С и нажимаете кнопку "Распознать и загрузить".

8400 5880 руб.

04.06.2019    107613    313    173    

326

Документооборот и делопроизводство (СЭД) Мессенджеры и боты Учет документов Платформа 1С v8.3 1С:Управление нашей фирмой 1.6 1С:Бухгалтерия государственного учреждения 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 Платные (руб)

Расширение для согласования справочников и документов в основных типовых конфигурациях. Ролевая адресация, условная маршрутизация, чат-бот telegram, интеграция с n8n, последовательное и параллельное согласование, уведомление о новых задачах на почту, блокировка объектов в зависимости от статуса, запрет проведения в зависимости от статуса, автозапуск процессов согласования, отчеты по исполнительской дисциплине. Не требуется снятие конфигурации с поддержки. Настройка без программирования. Версия для 1cfresh.com. Сертификат 1С-Совместимо.

14900 руб.

15.11.2018    30502    35    49    

71

Перенос данных 1C Документооборот и делопроизводство (СЭД) Учет документов Системный администратор Программист Бухгалтер Платформа 1С v8.3 Бухгалтерский учет 1С:Бухгалтерия 3.0 Бухгалтерский учет Платные (руб)

Бесшовная интеграция с 1С:Документооборот (КОРП или ПРОФ) - вот что обеспечит Вам и Вашим сотрудникам оперативный доступ и продуктивную работу с документами в учётной системе 1С на базе "1С:Бухгалтерия предприятия 3.0 ПРОФ". Бесшовный обмен и связь позволяют экономить до 60% времени на поиск и согласование первичной документации (актов, счетов-фактур, накладных), не говоря уже о других полезных функциональных возможностях: создании и запуске бизнес-процессов, работе с электронной почтой, штрихкодировании документов и многом другом.

30000 руб.

23.05.2017    56576    36    68    

42

Документооборот и делопроизводство (СЭД) ЭДО и ОФД Учет документов Платформа 1С v8.3 Конфигурации 1cv8 Россия Платные (руб)

Мощный, единый инструмент для решения всех проблем, связанных с переходом на ЭДО. Экономит бумагу и время - организует архив оригиналов первичных документов прямо в базе 1С, в прикрепленных файлах к соответствующим документам. С помощью комплексного отчета по ошибкам в ЭДО позволяет выявить и исправить все возможные ошибки - ошибочно сопоставленные документы, не подписанные документы, подписанные, но не загруженные в 1С документы. Автоматически сопоставляет не сопоставленные между собой документы. Может работать по расписанию и присылать отчет о состоянии архива/по ошибкам на почту. Взаимодействует напрямую с сервисами Диадок/СБИС, имеет интуитивно понятный интерфейс и учитывает 3-х летний опыт 40+ клиентов.

14880 руб.

17.12.2018    45791    66    61    

79

Печатные формы Документооборот и делопроизводство (СЭД) Учет документов Бухгалтер Пользователь Платформа 1С v8.3 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Зарплата и Управление Персоналом 3.x Бухгалтерский учет Управленческий учет Платные (руб)

Приложение для быстрого создания макетов печатных документов, заполняемых из 1С:Предприятие, без привлечения программистов и запуска конфигуратора. Шаблон готовится в редакторе MS Word, отлично освоенном офисными служащими. Так, на подготовку нового шаблона договора купли продажи со спецификацией потребуется 25 минут. Приложение будет полезно, если Вы работаете со множеством Word-шаблонов или если Вам надо часто создавать новые шаблоны. Есть сертификат "1С: Совместимо!". Версия ПРОФ доступна в виде расширения.

2000 руб.

05.09.2017    92721    67    100    

101
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. duck 367 22.06.19 16:47 Сейчас в теме
Добрый день! А на каких условиях используются решения ABBYY? Это ведь наверняка коммерческие продукты.
2. trim89 110 23.06.19 01:43 Сейчас в теме
(1) добрый. Пользователь сам достаёт продукт Abby любым удобным для него способом и пользуется им сам. Лишних пару млн для покупки ядра, для встраиванья в решение, у меня нет.
3. batonbrest 7 01.12.19 18:18 Сейчас в теме
Добрый день!

Выбрал вариант работы через API.

попробовал распознать счет из pdf летит ошибка, взял картинку png из статьи, та же ошибка:

Распознование Текста, {ОбщийМодуль.ДлительныеОперации.Модуль(534)}: Ошибка при вызове процедуры ВыполнитьМетодКонфигурации общего модуля ДлительныеОперации.
Ошибка разбора XML: - [1,1]
Фатальная ошибка:
Extra content at the end of the document


не подскажите в чем может быть проблема?
4. trim89 110 02.12.19 00:38 Сейчас в теме
(3) Добрый. Я это тестировал больше полугода назад. Тогда они отсылали ответ в формате xml. Возможно что-то поменялось. В декабре-январе хотел перетестировать данную функцию.
5. batonbrest 7 02.12.19 22:49 Сейчас в теме
(4) Я как то получить код модуля можно? Можете в личку ответить...
6. trim89 110 03.12.19 02:21 Сейчас в теме
(5)нельзя. Имеет смысл перенести получение самого файла в общий модуль, а парсер оставить в закрытом. Как закончу, на яндекс диск выложить и в личку написать. Выложил бы тут, но я не знаю как бесплатным сделать. Всегда требует какую то сумму.
7. batonbrest 7 03.12.19 22:26 Сейчас в теме
(6) да, было бы неплохо получить доступ хотя бы к коду получения файла. Парсер сделаем сами, под свои требования. С нетерпением буду ждать от вас ссылку на яндекс диск. Спасибо большое)
8. LineykaSBK 6 14.04.21 09:14 Сейчас в теме
Прежде чем скачивать есть пару вопросов.
1. Для какой(их) конфигурации(ий) предназначена обработка?
2. Если установлен продукт Abby на клиенте, то будет ли работать на актуальных, на сегодня версиях конфигураций?
10. trim89 110 14.04.21 12:54 Сейчас в теме
(8)
1) Это не обработка, а расширение. Оно полностью автономно. В теории подходит к любой конфе на управляемых формах.
2) Расширение с помощью abbyy конвертирует изображение в html, что бы сохранилась структура, а потом парсит html типовыми средствами. Конвертирует через команды cmd. То есть конкретно с конфигурацией это не связано.

Кстати, это ооочень устаревшая штука. У меня пока руки не дошли тут всё исправить. Актуальная инфа тут http://www.docent.software
9. trim89 110 14.04.21 12:52 Сейчас в теме
11. LineykaSBK 6 15.04.21 15:32 Сейчас в теме
посмотрел. надежнее, быстрее обмениваться документами среди пользователей 1С в формате xml через пиктограмму конверт у любого документа 1С. быстрее и надежнее в будущем своих контрагентов перевести на обмен в формате xml. Спасибо за информацию.
12. trim89 110 11.01.22 04:33 Сейчас в теме
Снял защиту, выкладываю в общий доступ.
13. VyacheslavShilov 11.12.24 12:12 Сейчас в теме
Добрый день.
Насколько рабочее расширение сейчас?
http://docent.software - недоступен адрес. Это на что-то влияет для работы расширения?
Оставьте свое сообщение