Автоматическое распознавание PDF через ИИ

29.09.25

Интеграция - Нейросети

Автоматическое распознавание PDF-накладных через Azure Document Intelligence - мощный AI-сервис от Microsoft для извлечения данных без парсинга и конвертации. Легко адаптируется под Ваши нужды, точность до 99%.

Файлы

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование Скачано Купить файл
Автоматическое распознавание PDF через ИИ
.epf 12,71Kb
4 2 150 руб. Купить

Подписка PRO — скачивайте любые файлы со скидкой до 85% из Базы знаний

Оформите подписку на компанию для решения рабочих задач

Оформить подписку и скачать решение со скидкой

Предлагаю рассмотреть вариант парсинга PDF-накладных через предобученную AI модель на портале Azure. Предобученные модели Azure (prebuilt-invoice) понимают стандартные поля: номер, дата, сумма НДС, общая сумма, поставщик, товары с количествами, ценами и EAN-кодами. Точность - до 99% на типовых документах, и все это за копейки (бесплатный тариф на 500 страниц в месяц хватит для тестов и малого бизнеса). Далее покажу, как интегрировать Azure AI в 1С: от создания ресурса в Azure до готовой обработки на 1С, которая получает сразу структурированные данные в JSON формате без необходимости парсинга и конвертации файлов. Обработка работает на платформах 8.3+ (тонкий и толстый клиент), не требует установки дополнительных библиотек и легко адаптируется под конкретные задачи.

 

Шаг 1: Регистрация и создание ресурса в Azure

 

Чтобы использовать Azure Document Intelligence, вам нужен аккаунт на https://portal.azure.com. Если его нет - зарегистрируйтесь бесплатно (Microsoft дает кредиты на старте). Перейдите в раздел "Create a resource" и в поиске введите "Document Intelligence".

 

 

На странице создания ресурса укажите:

  • Подписка: Выберите существующую или создайте новую (бесплатная пробная подойдет).
  • Группа ресурсов: Создайте новую или используйте существующую.
  • Регион: Выберите ближайший к вам.
  • Имя ресурса: Придумайте уникальное имя.
  • Ценовая категория: Для тестов идеально Free F0 (500 страниц/месяц, 20 вызовов/минуту). Если нужно больше - перейдите на Standard S0.
  • Остальные настройки: оставьте по умолчанию или настройте под свои задачи.

Нажмите "Review + create" и подождите 1-10 минут. Ресурс готов!

Теперь перейдите на страницу ресурса (Overview) и скопируйте ключевые значения:

  • Key 1: Это API-ключ для аутентификации.
  • Endpoint: Полный URL ресурса (например, https://your-name.cognitiveservices.azure.com/), но в обработке используем без "https://".

Эти данные Вы вставите в поля 1С обработки позже.

 

 

 

Шаг 2: Тестируем распознавание в Document Intelligence Studio

 

Прежде чем переходить в 1С, проверьте, как Azure видит ваши документы. На странице созданного ресурса кликните "Go to Document Intelligence Studio" -> Выберите "Prebuilt models" -> "Invoices" - это предобученная модель для счетов-фактур/накладных.

 

 

Проверьте, что выбраны верные настройки API-версия: 2024-11-30 и модель: prebuilt-invoice.

Загрузите свой PDF и нажмите "Run analysis". Через секунды увидите:

  • Визуальную разметку: Как AI выделил поля на документе (с уверенностью в %).
  • JSON-вывод: Структурированные данные с InvoiceId, InvoiceDate, DueDate, TotalTax, InvoiceTotal и Items (список товаров с Quantity, UnitPrice, Amount, ProductCode).

На скриншоте ниже - пример от Microsoft: AI идеально извлек данные из типовой накладной, включая таблицу товаров. Если ваши документы нестандартные - попробуйте Custom models, но для большинства случаев prebuilt хватит.

 

 

 

Шаг 3: Обработка в 1С - интеграция с Azure

 

Теперь перейдем к описанию обработки на 1С, которая отправляет PDF в Azure и получает в ответ структурированный JSON-результат.

 

 

Универсальная внешняя обработка работает в толстом и тонком клиенте достаточно просто:

  1. Выбираете файл PDF, указываете значения в APIKey и Endpoint.
  2. Нажимаете "Распознать" -> отправляется POST-запрос в Azure.
  3. Получаете готовый JSON от Azure AI с уже полностью распознанными полями: никакого ручного парсинга не требуется, остается только обратиться к данным по именам: InvoiceId, InvoiceDate, DueDate, TotalTax, InvoiceTotal, Quantity, UnitPrice, Amount, ProductCode.
  4. Выводит результат в консоль (можно адаптировать под загрузку в документы 1C).

Примечание: Возможно для больших PDF придется увеличить паузу ожидания ответа от Azure. По-умолчанию 15 сек.

Описанный подход может сэкономит часы труда программиста по написанию ручных парсингов накладных. Автоматизируйте рутину с AI. 🚀🤖

Возможно, Вас заинтересуют и другие публикации:

Проверено на следующих конфигурациях и релизах:

  • Управление торговлей, редакция 11, релизы 11.0.4.5

Вступайте в нашу телеграмм-группу Инфостарт

Azure распознавание PDF AI 1C накладные PDF Document Intelligence prebuilt-invoice JSON оптимизация парсинга накладных через AI Microsoft Azure интеграция API

См. также

Администрирование веб-серверов Сервера Нейросети Программист Платные (руб)

Сервер поиска по метаданным и поиска по коду, Сервер экспорта и поиска по документации, Сервер синтаксической проверки кода

17.06.2025    17039    0    Infostart    20    

113

Инструментарий разработчика Нейросети Платные (руб)

Первые попытки разработки на 1С с использованием больших языковых моделей (LLM) могут разочаровать. LLMки сильно галлюцинируют, потому что не знают устройства конфигураций 1С, не знают нюансов синтаксиса. Но если дать им подсказки с помощью MCP, то результат получается кардинально лучше. Далее в публикации: MCP для поиска по метаданым 1С, справке синтакс-помошника и проверки синтаксиса.

9900 руб.

25.08.2025    21934    55    9    

59

SALE! 30%

Учет документов Распознавание документов и образов Бухгалтер Пользователь 1С v8.3 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х Россия Платные (руб)

Одна из наиболее удобных обработок автоматического прикрепления большого количества документов-оригиналов к документам 1С. Для файлов поточного сканирования автоматически определяются начало и конец каждого документа. Поддерживаются штрихкоды, QR-коды, отсканированные PDF документы без штрихкодов, сформированные в ЭДО текстовые PDF документы. Поддерживаются входящие и исходящие документы-оригиналы.

6480 руб.

23.12.2021    15028    29    25    

12

Мастера заполнения Нейросети 1С v8.3 1C:Бухгалтерия 1С:Управление торговлей 11 Платные (руб)

Расширение для заполнения описания товара (номенклатуры) с помощью модели ИИ ChatGPT с ключевыми словами. Расширение формирует продающее описание товара по его наименованию с помощью модели искусственного интеллекта. Будет полезно для владельцев интернет магазинов, каталогов товаров и продающих через маркетплейсы. Адаптировано для основных конфигураций: УТ, ЕРП, КА, УНФ. Прошло аудит на 1cfresh.com. Версия для автоматического заполнения

5000 руб.

13.03.2023    21589    55    50    

79

Нейросети Пользователь 1С v8.3 1С:Управление нашей фирмой 1.6 1С:Управление торговлей 11 1С:Управление нашей фирмой 3.0 Оптовая торговля, дистрибуция, логистика Россия Управленческий учет Платные (руб)

Расширение "Искусственный интеллект и нейросети в 1С: Работа с отзывами маркетплейсов" предназначено для применения искусственного интеллекта в повседневной деятельности селлеров на маркетплейсах. Среди функций - работа с отзывами, вопросами и чатами покупателей, диалог с нейросетями, генерация картинок, заполнение описаний номенклатуры и другое.

6000 руб.

03.04.2024    11746    6    0    

11

Нейросети Программист Бесплатно (free)

Большие языковые модели все чаще применяются для генерации кода на 1С, но до сих пор нет единого способа объективно сравнить их качество. Объясняем, как работают метрики BLEU, CodeBLEU и pass@k, и как их можно адаптировать для оценки LLM в экосистеме 1С. Показываем, какие задачи – от простых функций до рефакторинга – помогают полноценно оценить интеллект модели и ее знание платформы. Разбираем ключевую проблему проверки логики и синтаксиса в автоматическом режиме и показываем бенчмарк, который решает эту задачу, сравнивая ChatGPT, Claude, GigaChat и другие модели по единым стандартам.

31.10.2025    2318    Vaslot    14    

16

Нейросети Рефакторинг и качество кода Программист Бесплатно (free)

ИИ для код-ревью – не просто модный тренд, а реальный инструмент, который уже помогает разработчикам экономить время и повышать качество кода. В статье разбираемся, как запустить локальную LLM на базе Ollama, подключить ее к Git через Webhook и Python-скрипт, а также какие параметры модели отвечают за точность и галлюцинации. Делимся схемой работы, настройками и результатами тестирования, доказывая, что автоматизированное код-ревью действительно может работать – даже без космического бюджета.

30.10.2025    2653    user2100900    3    

8
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. aximo 2517 29.09.25 09:16 Сейчас в теме
на python есть такая компонента, позволяет делать распознание - пытался применять его распознании "честного знака", но давала ошибки - отказался
3. da_1c 196 30.09.25 04:03 Сейчас в теме
(1) Пришлите мне пример вашего файла я загоню в модель и покажу как моделька его увидет
2. Константин С. 675 29.09.25 10:31 Сейчас в теме
такто Invoices редкая птица в наших краях :-)

Так-то интересно более приближенный пример к нашими реалиям.
4. da_1c 196 30.09.25 04:05 Сейчас в теме
(2) инвойс на англ включает все: он же накладная, счет-фактура, товарно-транспортная накладная и прочая... Пришлите мне свой файл, который Вы хотите распознавать, я загоню в модельку и покажу как она его увидит.
5. Константин С. 675 30.09.25 10:32 Сейчас в теме
(4) такто я сам это могу сделать. т.ч. на других Аишках еще и бесплатно, используя локации РФ.
А вашем случае получается теоретическая выкладка, чтожто хорошо.
Но без привязки на реальную работу по загрузки докумментов в УТ 11 (как написано в описании)
6. da_1c 196 30.09.25 18:23 Сейчас в теме
(5) поделитесь какими модельками Вы пользуетесь и в чем Вы видите их преимущество? Интересно будет посмотреть. Обработка реальная и может работать в любой конфигурации, и тестировалась на УТ 11 о чем и написано согласно правилам платформы в описании. Обработка предназначена для программистов и руководителей проектов, а не для пользователей. Если Вам нужна доработка под Вашу ситуацию, то обращайтесь в личку. Не увидел в Вашем ответе пример, который Вы хотите разобрать.
Для отправки сообщения требуется регистрация/авторизация