Расширение для загрузки в 1С сканов документов, pdf файлов, распознанных с помощью OCR

11.01.22

Функциональные - Документооборот и делопроизводство (СЭД)

Подсистема, предназначенная для автоматического разбора распознанного файла, извлечение из него полезной информации и загрузки данных в 1С.

Скачать файл

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование Бесплатно
Расширение для загрузки в 1С сканов документов, pdf файлов, распознанных с помощью OCR:
.cfe 758,14Kb
292
292 Скачать бесплатно

Предисловие

Данную подсистему сделал в свободное время, так как была интересна тема распознавания изображений. Потом, в компании, в которой работаю, оценили разработку и успешно используют в загрузке специфичных и сложных для ручной обработки документов от вендера.

Выкладываю с одной целью - понять, актуально ли данное решение для других компаний, так как сейчас набирает популярность ЭДО (хотя на данном этапе у него много минусов). Если актуально, то собрать пожелания, идеи и сделать продукт, который полезен и выгоден для пользователя. 

PS. Данная штука не особо никому не нужна. Выложил всё в открытый доступ. Всё предоставляется "как есть".

Требования

Платформа не менее 8.3.12, режим совместимости не менее 8.3.12. Система Windows.

Описание

Программа использует различные варианты распознавания. Tesseract, ABBY FineReader, ABBY Hot Folder, ABBY Recognition Server, ABBYY Cloud OCR SDK. Выбор продукта зависит от количество документов и удобства использования в целом. Выбор пал именно на продукты ABBY, так как именно они выдают результат с наиболее приемлемым качеством распознавания и, самое важное, сохраняют структуру исходного файла. 

По сути, данная разработка - парсер, которая выуживает определённым способом данные из распознанного файла данные, структурирует их, и по настройкам пользователя загружает в 1с. Более того, позволяет пользователю расширять список документов для автоматического распознавания, что позволяет загружать не только какие-то типовые формы, но и произвольные (которые соответствуют определенным критериям, о которых ниже), притом именно в те документы в 1с, которые нужны пользователю, и так, как это нужно именно пользователю, а не как предусмотрел разработчик.

Механизм работы следующий. Файл преобразуется в htm файл (или xml, при работе с облаком). Если блок данных распознаётся как таблица, то программа пытается получить шапку таблицы и на основании этих данных, пытается соотнести информацию в ячейках к конкретной колонке в шапке. Поэтому:

Ограничение №1: Шапка таблицы должна быть только горизонтальная

Ограничение №2: Строки таблицы не должны быть многоуровневыми

Ограничение №3: Таблица должна распознаться, следовательно в исходном документе должна быть явно выделена

Если блок не таблица, то программа считает, что это информации относящиеся к шапке документа и пытается выделить из него полезную информацию, такие как поставщик, покупатель, номер, дата и прочее.

После программа пытается полученный массив полезных блоков информации логически разделить на документы, так как один документ может быть разбит на несколько файлов, так и в одном файле может содержаться несколько документов.

Пользователю выводится список файлов, на каждый вид документа есть своя настройка загрузки. По этой настройке данные загружаются в 1с. 

Порядок установки, работы и нюансы более подробно в документации.

Пример

Счет из Демо-базы УТ

При распознавании данного файла получим следующий результат.

Загрузим в «Приобретение услуг и прочих активов». Сделаем следующие настройки.

Создадим документ.

Осталось проверить корректность загрузки и заполнить требуемые поля.

Готовое решение

Распознавание и загрузка сканов в 1С

Инструмент, который превращает скан накладной, счета, УПД или Excel-файл в готовый документ в 1С. За считанные секунды. Без ручного ввода. Без ошибок. С распознаванием даже нечётких фото.


OCR распознавание загрузка расширение

См. также

Бухгалтер Пользователь Руководитель проекта Платформа 1С v8.3 Управленческий учет Платные (руб)

Организуйте правильный оборот документов на вашем предприятии в 1С. Ведение учета и хранения документов. Управление потоками документации между подразделениями. Работа с договорами в компании. Автоматизация процессов подготовки, согласования и подписания документов. Сократите время и объем ошибок с 1С:ДО!

55300 руб.

19.02.2016    110399    136    5    

108

Бизнес-аналитик Бухгалтер Пользователь Платформа 1С v8.3 Бухгалтерский учет Налоговый учет Управленческий учет Платные (руб)

Комплексная автоматизация 1С — универсальное решение для управления предприятием и автоматизации учета, производства, продаж и финансов. Подходит для малого и среднего бизнеса. Купить программу 1С:Комплексная автоматизация 8 (редакция 2.5) можно по выгодной цене с электронной поставкой. Внедрение системы позволит объединить все ключевые процессы в одной платформе и повысить эффективность компании. Узнайте стоимость, сравните версии и закажите автоматизацию для вашего бизнеса с бонусом 15% в Инфостарт!

94700 руб.

19.02.2016    84190    117    0    

115

Платформа 1С v8.3 Платные (руб)

"1С:Архив" – это универсальная система, обеспечивающая надежное долговременное хранение документов с гарантией юридической значимости на неограниченный срок. "1С:Архив" разработан на основе нормативно-правовых актов по архивному делу, поддерживает операции хранения документов – от попадания в архив до уничтожения – и не имеет ограничений на объем хранимых данных. "1С:Архив" сопровождается методологической поддержкой в виде организационных документов по хранению, входящих в состав "Комплекта нормативных документов" к "Методике управления документами и совместной работой", разработанной специалистами фирмы "1С". Использование "1С:Архива" позволяет организовать единое хранилище всех бумажных и электронных документов из разных информационных систем, вести архивный учет в соответствии с требованиями Росархива и снизить нагрузку на учетные системы. Продукт подходит для малых, средних, крупных предприятий и учреждений любых отраслей.

117000 руб.

24.10.2022    5909    8    1    

7

Мессенджеры и боты Учет документов Платформа 1С v8.3 1С:Управление нашей фирмой 1.6 1С:Бухгалтерия государственного учреждения 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 Платные (руб)

Расширение для согласования справочников и документов в основных типовых конфигурациях. Ролевая адресация, условная маршрутизация, чат-бот telegram, интеграция с n8n, последовательное и параллельное согласование, уведомление о новых задачах на почту, блокировка объектов в зависимости от статуса, запрет проведения в зависимости от статуса, автозапуск процессов согласования, отчеты по исполнительской дисциплине. Не требуется снятие конфигурации с поддержки. Настройка без программирования. Версия для 1cfresh.com. Сертификат 1С-Совместимо.

14900 руб.

15.11.2018    34129    43    49    

75

ЭДО и ОФД Учет документов Платформа 1С v8.3 1C:Бухгалтерия Россия Платные (руб)

Мощный, единый инструмент для решения всех проблем, связанных с переходом на ЭДО. Экономит бумагу и время - организует архив оригиналов первичных документов прямо в базе 1С, в прикрепленных файлах к соответствующим документам.

14880 руб.

17.12.2018    47375    72    63    

80

Бухгалтер Пользователь Руководитель проекта Платформа 1С v8.3 Управленческий учет Платные (руб)

1С:Договоры 8 - удобный и эффективный инструмент для работы с договорами, особенно в организациях с развитой договорной деятельностью. Решение обладает широкими функциональными возможностями для простой подготовки, отслеживания и контроля исполнения договоров. Сокращайте время на договорную работу, держите под контролем процессы согласования, оплаты счета и находите нужный договор за считанные секунды. Приобретайте с бонусом 15% в Инфостарт!

5700 руб.

26.02.2016    32334    8    2    

14

Роли и права Системный администратор Платформа 1С v8.3 1С:Документооборот Управленческий учет Платные (руб)

Внешняя обработка позволит быстро добавить участников в любое количество документов, заменить целиком набор участников или удалить лишь некоторых из них для одного объекта или группы документов.

3500 руб.

23.10.2015    64631    117    25    

130
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. duck 301 22.06.19 16:47 Сейчас в теме
Добрый день! А на каких условиях используются решения ABBYY? Это ведь наверняка коммерческие продукты.
2. trim89 110 23.06.19 01:43 Сейчас в теме
(1) добрый. Пользователь сам достаёт продукт Abby любым удобным для него способом и пользуется им сам. Лишних пару млн для покупки ядра, для встраиванья в решение, у меня нет.
3. batonbrest 7 01.12.19 18:18 Сейчас в теме
Добрый день!

Выбрал вариант работы через API.

попробовал распознать счет из pdf летит ошибка, взял картинку png из статьи, та же ошибка:

Распознование Текста, {ОбщийМодуль.ДлительныеОперации.Модуль(534)}: Ошибка при вызове процедуры ВыполнитьМетодКонфигурации общего модуля ДлительныеОперации.
Ошибка разбора XML: - [1,1]
Фатальная ошибка:
Extra content at the end of the document


не подскажите в чем может быть проблема?
4. trim89 110 02.12.19 00:38 Сейчас в теме
(3) Добрый. Я это тестировал больше полугода назад. Тогда они отсылали ответ в формате xml. Возможно что-то поменялось. В декабре-январе хотел перетестировать данную функцию.
5. batonbrest 7 02.12.19 22:49 Сейчас в теме
(4) Я как то получить код модуля можно? Можете в личку ответить...
6. trim89 110 03.12.19 02:21 Сейчас в теме
(5)нельзя. Имеет смысл перенести получение самого файла в общий модуль, а парсер оставить в закрытом. Как закончу, на яндекс диск выложить и в личку написать. Выложил бы тут, но я не знаю как бесплатным сделать. Всегда требует какую то сумму.
7. batonbrest 7 03.12.19 22:26 Сейчас в теме
(6) да, было бы неплохо получить доступ хотя бы к коду получения файла. Парсер сделаем сами, под свои требования. С нетерпением буду ждать от вас ссылку на яндекс диск. Спасибо большое)
8. LineykaSBK 6 14.04.21 09:14 Сейчас в теме
Прежде чем скачивать есть пару вопросов.
1. Для какой(их) конфигурации(ий) предназначена обработка?
2. Если установлен продукт Abby на клиенте, то будет ли работать на актуальных, на сегодня версиях конфигураций?
10. trim89 110 14.04.21 12:54 Сейчас в теме
(8)
1) Это не обработка, а расширение. Оно полностью автономно. В теории подходит к любой конфе на управляемых формах.
2) Расширение с помощью abbyy конвертирует изображение в html, что бы сохранилась структура, а потом парсит html типовыми средствами. Конвертирует через команды cmd. То есть конкретно с конфигурацией это не связано.

Кстати, это ооочень устаревшая штука. У меня пока руки не дошли тут всё исправить. Актуальная инфа тут http://www.docent.software
9. trim89 110 14.04.21 12:52 Сейчас в теме
11. LineykaSBK 6 15.04.21 15:32 Сейчас в теме
посмотрел. надежнее, быстрее обмениваться документами среди пользователей 1С в формате xml через пиктограмму конверт у любого документа 1С. быстрее и надежнее в будущем своих контрагентов перевести на обмен в формате xml. Спасибо за информацию.
12. trim89 110 11.01.22 04:33 Сейчас в теме
Снял защиту, выкладываю в общий доступ.
13. VyacheslavShilov 11.12.24 12:12 Сейчас в теме
Добрый день.
Насколько рабочее расширение сейчас?
http://docent.software - недоступен адрес. Это на что-то влияет для работы расширения?
Оставьте свое сообщение