Предлагаю рассмотреть вариант парсинга PDF-накладных через предобученную AI модель на портале Azure. Предобученные модели Azure (prebuilt-invoice) понимают стандартные поля: номер, дата, сумма НДС, общая сумма, поставщик, товары с количествами, ценами и EAN-кодами. Точность - до 99% на типовых документах, и все это за копейки (бесплатный тариф на 500 страниц в месяц хватит для тестов и малого бизнеса). Далее покажу, как интегрировать Azure AI в 1С: от создания ресурса в Azure до готовой обработки на 1С, которая получает сразу структурированные данные в JSON формате без необходимости парсинга и конвертации файлов. Обработка работает на платформах 8.3+ (тонкий и толстый клиент), не требует установки дополнительных библиотек и легко адаптируется под конкретные задачи.
Шаг 1: Регистрация и создание ресурса в Azure
Чтобы использовать Azure Document Intelligence, вам нужен аккаунт на https://portal.azure.com. Если его нет - зарегистрируйтесь бесплатно (Microsoft дает кредиты на старте). Перейдите в раздел "Create a resource" и в поиске введите "Document Intelligence".
На странице создания ресурса укажите:
- Подписка: Выберите существующую или создайте новую (бесплатная пробная подойдет).
- Группа ресурсов: Создайте новую или используйте существующую.
- Регион: Выберите ближайший к вам.
- Имя ресурса: Придумайте уникальное имя.
- Ценовая категория: Для тестов идеально Free F0 (500 страниц/месяц, 20 вызовов/минуту). Если нужно больше - перейдите на Standard S0.
- Остальные настройки: оставьте по умолчанию или настройте под свои задачи.
Нажмите "Review + create" и подождите 1-10 минут. Ресурс готов!
Теперь перейдите на страницу ресурса (Overview) и скопируйте ключевые значения:
- Key 1: Это API-ключ для аутентификации.
- Endpoint: Полный URL ресурса (например, https://your-name.cognitiveservices.azure.com/), но в обработке используем без "https://".
Эти данные Вы вставите в поля 1С обработки позже.
Шаг 2: Тестируем распознавание в Document Intelligence Studio
Прежде чем переходить в 1С, проверьте, как Azure видит ваши документы. На странице созданного ресурса кликните "Go to Document Intelligence Studio" -> Выберите "Prebuilt models" -> "Invoices" - это предобученная модель для счетов-фактур/накладных.
Проверьте, что выбраны верные настройки API-версия: 2024-11-30 и модель: prebuilt-invoice.
Загрузите свой PDF и нажмите "Run analysis". Через секунды увидите:
- Визуальную разметку: Как AI выделил поля на документе (с уверенностью в %).
- JSON-вывод: Структурированные данные с InvoiceId, InvoiceDate, DueDate, TotalTax, InvoiceTotal и Items (список товаров с Quantity, UnitPrice, Amount, ProductCode).
На скриншоте ниже - пример от Microsoft: AI идеально извлек данные из типовой накладной, включая таблицу товаров. Если ваши документы нестандартные - попробуйте Custom models, но для большинства случаев prebuilt хватит.
Шаг 3: Обработка в 1С - интеграция с Azure
Теперь перейдем к описанию обработки на 1С, которая отправляет PDF в Azure и получает в ответ структурированный JSON-результат.
Универсальная внешняя обработка работает в толстом и тонком клиенте достаточно просто:
- Выбираете файл PDF, указываете значения в APIKey и Endpoint.
- Нажимаете "Распознать" -> отправляется POST-запрос в Azure.
- Получаете готовый JSON от Azure AI с уже полностью распознанными полями: никакого ручного парсинга не требуется, остается только обратиться к данным по именам: InvoiceId, InvoiceDate, DueDate, TotalTax, InvoiceTotal, Quantity, UnitPrice, Amount, ProductCode.
- Выводит результат в консоль (можно адаптировать под загрузку в документы 1C).
Примечание: Возможно для больших PDF придется увеличить паузу ожидания ответа от Azure. По-умолчанию 15 сек.
Описанный подход может сэкономит часы труда программиста по написанию ручных парсингов накладных. Автоматизируйте рутину с AI. 🚀🤖
Возможно, Вас заинтересуют и другие публикации:
- SFTP для 1С
- CI/CD для 1С: как упростить себе жизнь
- Фоновые задания: быстро получить большие данные в 1С
- Создание пользователей системы взаимодействия
- Работа из 1С с API PayPal
- Гарантированный обмен 1С через Microsoft MSMQ
- Чтение файлов PDF из 1С
- Программное открытие отчета
- История реквизитов организаций
Проверено на следующих конфигурациях и релизах:
- Управление торговлей, редакция 11, релизы 11.0.4.5
Вступайте в нашу телеграмм-группу Инфостарт