Расширение для загрузки в 1С сканов документов, pdf файлов, распознанных с помощью OCR

11.01.22

Функциональные - Документооборот и делопроизводство (СЭД)

Подсистема, предназначенная для автоматического разбора распознанного файла, извлечение из него полезной информации и загрузки данных в 1С.

Бесплатные

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Узнавайте о новых бесплатных решениях в нашей телеграм-группе Инфостарт БЕСПЛАТНО

Наименование Скачано Бесплатно
Расширение для загрузки в 1С сканов документов, pdf файлов, распознанных с помощью OCR:
.cfe 758,14Kb
325 Скачать бесплатно

Предисловие

Данную подсистему сделал в свободное время, так как была интересна тема распознавания изображений. Потом, в компании, в которой работаю, оценили разработку и успешно используют в загрузке специфичных и сложных для ручной обработки документов от вендера.

Выкладываю с одной целью - понять, актуально ли данное решение для других компаний, так как сейчас набирает популярность ЭДО (хотя на данном этапе у него много минусов). Если актуально, то собрать пожелания, идеи и сделать продукт, который полезен и выгоден для пользователя. 

PS. Данная штука не особо никому не нужна. Выложил всё в открытый доступ. Всё предоставляется "как есть".

Требования

Платформа не менее 8.3.12, режим совместимости не менее 8.3.12. Система Windows.

Описание

Программа использует различные варианты распознавания. Tesseract, ABBY FineReader, ABBY Hot Folder, ABBY Recognition Server, ABBYY Cloud OCR SDK. Выбор продукта зависит от количество документов и удобства использования в целом. Выбор пал именно на продукты ABBY, так как именно они выдают результат с наиболее приемлемым качеством распознавания и, самое важное, сохраняют структуру исходного файла. 

По сути, данная разработка - парсер, которая выуживает определённым способом данные из распознанного файла данные, структурирует их, и по настройкам пользователя загружает в 1с. Более того, позволяет пользователю расширять список документов для автоматического распознавания, что позволяет загружать не только какие-то типовые формы, но и произвольные (которые соответствуют определенным критериям, о которых ниже), притом именно в те документы в 1с, которые нужны пользователю, и так, как это нужно именно пользователю, а не как предусмотрел разработчик.

Механизм работы следующий. Файл преобразуется в htm файл (или xml, при работе с облаком). Если блок данных распознаётся как таблица, то программа пытается получить шапку таблицы и на основании этих данных, пытается соотнести информацию в ячейках к конкретной колонке в шапке. Поэтому:

Ограничение №1: Шапка таблицы должна быть только горизонтальная

Ограничение №2: Строки таблицы не должны быть многоуровневыми

Ограничение №3: Таблица должна распознаться, следовательно в исходном документе должна быть явно выделена

Если блок не таблица, то программа считает, что это информации относящиеся к шапке документа и пытается выделить из него полезную информацию, такие как поставщик, покупатель, номер, дата и прочее.

После программа пытается полученный массив полезных блоков информации логически разделить на документы, так как один документ может быть разбит на несколько файлов, так и в одном файле может содержаться несколько документов.

Пользователю выводится список файлов, на каждый вид документа есть своя настройка загрузки. По этой настройке данные загружаются в 1с. 

Порядок установки, работы и нюансы более подробно в документации.

Пример

Счет из Демо-базы УТ

При распознавании данного файла получим следующий результат.

Загрузим в «Приобретение услуг и прочих активов». Сделаем следующие настройки.

Создадим документ.

Осталось проверить корректность загрузки и заполнить требуемые поля.

Распознавание и загрузка сканов в 1С

Решение «Распознавание и загрузка сканов в 1С» — интеллектуальный инструмент, превращающий сканы накладных, счетов, УПД или Excel-файлов в готовые документы 1С. Без ручного ввода и ошибок — с распознаванием даже нечетких фото. Оптимизируйте документооборот и автоматизируйте рутину с помощью ИИ-распознавания.

Вступайте в нашу телеграмм-группу Инфостарт

OCR распознавание загрузка расширение

См. также

Бухгалтер Пользователь Руководитель проекта 1С:Предприятие 8 Управленческий учет Платные (руб)

Организуйте правильный оборот документов на вашем предприятии в 1С. Ведение учета и хранения документов. Управление потоками документации между подразделениями. Работа с договорами в компании. Автоматизация процессов подготовки, согласования и подписания документов. Сократите время и объем ошибок с 1С:Документооборот! С 1 апреля 2026 года стоимость решения изменится в среднем на 14%. Успейте приобрести по текущей цене с бонусами на услуги и сервисы Инфостарт!

55300 руб.

19.02.2016    112901    144    5    

115

1С:Предприятие 8 Платные (руб)

"1С:Архив" – это универсальная система для надежного долговременного хранения документов с гарантией юридической значимости на неограниченный срок. Решение разработано на основе нормативно-правовых актов по архивному делу, поддерживает операции хранения документов: от попадания в архив до уничтожения, и не имеет ограничений на объем хранимых данных. "1С:Архив" сопровождается методологической поддержкой в виде организационных документов по хранению, входящих в состав "Комплекта нормативных документов" к "Методике управления документами и совместной работой", разработанной специалистами фирмы "1С". Использование "1С:Архива" позволяет организовать единое хранилище всех бумажных и электронных документов из разных информационных систем, вести архивный учет в соответствии с требованиями Росархива и снизить нагрузку на учетные системы. С 1 апреля 2026 года стоимость изменится на 14%, успейте купить решение по цене 2025 года!

117000 руб.

24.10.2022    7240    11    1    

11

Печатные формы Бухгалтер Пользователь 1С:Предприятие 8 1С:Управление нашей фирмой 1.6 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 1С:Розница 3.0 Бухгалтерский учет Управленческий учет Платные (руб)

Расширение для печати договоров с приложением из шаблонов. Быстрая подготовка заполненных договоров без ручного заполнения. Возможность использования дополнительных реквизитов контрагентов и номенклатуры Быстрое сохранение файлов договоров и отправка по электронной почте. Решение в Реестре отечественного ПО.

15000 руб.

20.04.2016    66566    190    107    

104

Мессенджеры и боты Учет документов 1С:Предприятие 8 1С:Управление нашей фирмой 1.6 1С:Бухгалтерия государственного учреждения 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление холдингом 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 Платные (руб)

Расширение для согласования справочников и документов в основных типовых конфигурациях. Ролевая адресация, условная маршрутизация, чат-бот telegram, интеграция с n8n, последовательное и параллельное согласование, уведомление о новых задачах на почту, блокировка объектов в зависимости от статуса, запрет проведения в зависимости от статуса, автозапуск процессов согласования, отчеты по исполнительской дисциплине. Не требуется снятие конфигурации с поддержки. Настройка без программирования. Версия для 1cfresh.com. Сертификат 1С-Совместимо.

14900 руб.

15.11.2018    40351    44    55    

79

Печатные формы Учет документов Бухгалтер Пользователь 1С:Предприятие 8 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Зарплата и Управление Персоналом 3.x Бухгалтерский учет Управленческий учет Платные (руб)

Приложение для быстрого создания макетов печатных документов, заполняемых из 1С:Предприятие, без привлечения программистов и запуска конфигуратора. Шаблон готовится в редакторе MS Word, отлично освоенном офисными служащими. Так, на подготовку нового шаблона договора купли продажи со спецификацией потребуется 25 минут. Приложение будет полезно, если Вы работаете со множеством Word-шаблонов или если Вам надо часто создавать новые шаблоны. Есть сертификат "1С: Совместимо!". Версия ПРОФ доступна в виде расширения.

2000 руб.

05.09.2017    96973    72    106    

104

Email рассылки Взаиморасчеты Акт сверки Бухгалтер 1С:Предприятие 8 1С:Бухгалтерия 3.0 Бухгалтерский учет Платные (руб)

Данная обработка позволяет сократить объем ручных операций, выполняемых ежемесячно бухгалтером или его помощником за счет автоматизации систематического процесса.

7800 руб.

12.02.2019    36240    30    24    

28
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. duck 288 22.06.19 16:47 Сейчас в теме
Добрый день! А на каких условиях используются решения ABBYY? Это ведь наверняка коммерческие продукты.
2. trim89 128 23.06.19 01:43 Сейчас в теме
(1) добрый. Пользователь сам достаёт продукт Abby любым удобным для него способом и пользуется им сам. Лишних пару млн для покупки ядра, для встраиванья в решение, у меня нет.
3. batonbrest 7 01.12.19 18:18 Сейчас в теме
Добрый день!

Выбрал вариант работы через API.

попробовал распознать счет из pdf летит ошибка, взял картинку png из статьи, та же ошибка:

Распознование Текста, {ОбщийМодуль.ДлительныеОперации.Модуль(534)}: Ошибка при вызове процедуры ВыполнитьМетодКонфигурации общего модуля ДлительныеОперации.
Ошибка разбора XML: - [1,1]
Фатальная ошибка:
Extra content at the end of the document


не подскажите в чем может быть проблема?
4. trim89 128 02.12.19 00:38 Сейчас в теме
(3) Добрый. Я это тестировал больше полугода назад. Тогда они отсылали ответ в формате xml. Возможно что-то поменялось. В декабре-январе хотел перетестировать данную функцию.
5. batonbrest 7 02.12.19 22:49 Сейчас в теме
(4) Я как то получить код модуля можно? Можете в личку ответить...
6. trim89 128 03.12.19 02:21 Сейчас в теме
(5)нельзя. Имеет смысл перенести получение самого файла в общий модуль, а парсер оставить в закрытом. Как закончу, на яндекс диск выложить и в личку написать. Выложил бы тут, но я не знаю как бесплатным сделать. Всегда требует какую то сумму.
7. batonbrest 7 03.12.19 22:26 Сейчас в теме
(6) да, было бы неплохо получить доступ хотя бы к коду получения файла. Парсер сделаем сами, под свои требования. С нетерпением буду ждать от вас ссылку на яндекс диск. Спасибо большое)
8. LineykaSBK 6 14.04.21 09:14 Сейчас в теме
Прежде чем скачивать есть пару вопросов.
1. Для какой(их) конфигурации(ий) предназначена обработка?
2. Если установлен продукт Abby на клиенте, то будет ли работать на актуальных, на сегодня версиях конфигураций?
10. trim89 128 14.04.21 12:54 Сейчас в теме
(8)
1) Это не обработка, а расширение. Оно полностью автономно. В теории подходит к любой конфе на управляемых формах.
2) Расширение с помощью abbyy конвертирует изображение в html, что бы сохранилась структура, а потом парсит html типовыми средствами. Конвертирует через команды cmd. То есть конкретно с конфигурацией это не связано.

Кстати, это ооочень устаревшая штука. У меня пока руки не дошли тут всё исправить. Актуальная инфа тут http://www.docent.software
9. trim89 128 14.04.21 12:52 Сейчас в теме
11. LineykaSBK 6 15.04.21 15:32 Сейчас в теме
посмотрел. надежнее, быстрее обмениваться документами среди пользователей 1С в формате xml через пиктограмму конверт у любого документа 1С. быстрее и надежнее в будущем своих контрагентов перевести на обмен в формате xml. Спасибо за информацию.
12. trim89 128 11.01.22 04:33 Сейчас в теме
Снял защиту, выкладываю в общий доступ.
13. VyacheslavShilov 11.12.24 12:12 Сейчас в теме
Добрый день.
Насколько рабочее расширение сейчас?
http://docent.software - недоступен адрес. Это на что-то влияет для работы расширения?
Для отправки сообщения требуется регистрация/авторизация