Распознавание PDF и заполнение табличных частей документов

13.03.26

Интеграция - Распознавание документов и образов

Тестируем, как ИИ распознает разные pdf, и результат пробуем запихнуть в документы 1С... Нужна установленная LM Studio и видеокарта. На 1660 супер работает так себе (по скорости). На 3070 уже бодрее. На 50 серии пока не тестировал. Распознавание 1 страницы (секунд 10-40). Из пдф картинка делается, и она уже отдается ИИ. Поэтому в обработке преобразователь картинок. При первом запуске положится сам в темпы. Писал для себя - в коде полный бардак - т.к. хотелось быстрее. Но все пашет и в файловой, и на серверах.

Файлы

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование Скачано Купить файл
Распознавание PDF и заполнение табличных частей документов
.epf 23,92Mb
2 3 000 руб. Купить

Подписка PRO — скачивайте любые файлы со скидкой до 85% из Базы знаний

Оформите подписку на компанию для решения рабочих задач

Оформить подписку и скачать решение со скидкой

Чукча не писатель - только программист.

Тестируем, как ИИ распознает разные pdf, и результат пробуем запихнуть в документы 1С...

Все настройки в скринах - если что не понятно - выложу еще скрины.

Нужна установленная LM Studio (и загруженная в нее модель mradermacher/next-ocr) и видеокарта.

htt__://lmstudio.ai/

На 1660 супер работает так себе (по скорости). На 3070 уже бодрее. На 50 серии пока не тестировал.

Распознавание 1 страницы (секунд 10-40).

Писал для себя - в коде полный бардак - т.к. хотелось быстрее. Но все пашет и в файловой, и на серверах.

Разные модели работают по разному и выдают разные ответы  и результаты.

Эта выбрана как самая быстрая и не тупая.

Неделю возился со всем этим. 

Настроение часто менялось от "Да что ж ты такая тупая" до "Охренеть - начал давать одинаковые результаты на одни и те же вопросы".

Какие минусы. Это распознавание. ИИ может путать цифру 6 и букву б и много чего еще.

Особенно если в наименовании есть русские и английские буквы.

Да, оно работает в фоне...

Но для начала попробуйте ручками поработать в LM Studio. И отдать ему картинку.

Поймете скорость и что он может и на каких объемах.

Сорри за помарки в описании и в обработке.

Для начала идем в настройки - вбиваем адрес ИИ и жмем выбор модели - если список есть - то значит подключение к ЛМ работает.

Я ему давал Счет-фактуру на 2х страницах сразу - задумывается минут на 2-3. Контекст для такого я ставил 40000-50000. Но результат дает.

Пашет на БП 3... Да и должна работать на всех современных 1С.

Там практически все внутри забито.

Проверено на следующих конфигурациях и релизах:

  • Бухгалтерия предприятия, редакция 3.0, релизы 3.0.186.16

Вступайте в нашу телеграмм-группу Инфостарт

Обработка Искусственный интеллект PDF OCR LM Studio Api Бухгалтерия Заполнение документов

См. также

Учет документов Распознавание документов и образов Бухгалтер Пользователь 1С:Предприятие 8 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х Россия Платные (руб)

Одна из наиболее удобных обработок автоматического прикрепления большого количества документов-оригиналов к документам 1С. Для файлов поточного сканирования автоматически определяются начало и конец каждого документа. Поддерживаются штрихкоды, QR-коды, отсканированные PDF документы без штрихкодов, сформированные в ЭДО текстовые PDF документы. Поддерживаются входящие и исходящие документы-оригиналы.

6588 руб.

23.12.2021    15967    30    25    

12

SALE! 30%

Нейросети Распознавание документов и образов Программист Бухгалтер Пользователь 1С 8.3 1С:Комплексная автоматизация 1.х 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 Россия Абонемент ($m)

Решение поставляется в 2 версиях: при наличии видеокарты расширение+GPU версия или расширение+СPU версия. Поддерживает 3 режима работы, локальное (на вашем ПК), ИИ-модель (облачная), гибридная локальная+ИИ. В локальном режиме распознавание бесплатно. В ИИ режиме в среднем 0.5 рубля за страницу. Неограниченное количество пользователей. Распознает сканы: УПД, счета-фактуры, товарные накладные. Проверяет цифры и помогает создавать документы в 1С. Отправляйте документы через Telegram бот

10 стартмани

20.02.2026    635    1    dasan92    0    

3

Распознавание документов и образов Программист 1С 8.3 Бесплатно (free)

Рано или поздно каждый 1С-специалист может столкнуться с фактически нерешаемой задачей: организацией загрузки из файла контрагента, где данные предлагается синхронизировать по строке, например, наименованию номенклатуры. Зачастую это строковое представление лишь отдаленно напоминает наименование из соответствующего справочника информационной базы заказчика. То есть фактически контрагент произвольно излагает своё желание, а заказчик требует автоматизировать процесс сопоставления. Надо понимать, что 100% решения задачи не существует. Например, если при анализе примеров стало понятно, что клиентам несвойственна грамотность, лучше вообще не браться за такую автоматизацию. Тем не менее, задачу сопоставления строки из последовательности слов с наименованиями из справочника, где порядок слов может различаться, автору удалось решить в приемлемом для заказчика виде. Предлагаются формулировка условий задачи и подходы к реализации решения

09.02.2026    439    Sergey1CSpb    0    

1

Распознавание документов и образов Бухгалтер Пользователь 1С 8.3 1С:Бухгалтерия 3.0 Россия Абонемент ($m)

Пример реализации считывания данных с PDF-файла на примере счета-фактуры. Обработку можно подключить к любой конфигурации, т.к. она не затрагивает метаданные.

1 стартмани

05.02.2026    506    6    user213093test    0    

3

Распознавание документов и образов Программист Пользователь 1С 8.3 1С:Розница 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Управление нашей фирмой 3.0 1С:Розница 3.0 Абонемент ($m)

Управление 1С голосом (в любой конфигурации), преобразование голоса в текст в текстовых реквизитах форм, в полях ввода с поиском по значению реквизита и т.д. и т.п.

2 стартмани

19.12.2025    2622    7    kras_71    24    

12

Распознавание документов и образов Программист Пользователь 1С:Предприятие 8 Россия Абонемент ($m)

Решение на платформе 1С для автоматической расшифровки голосовых сообщений из Telegram. Система отслеживает новые аудио в чат-боте, передает их на локальный сервер с Whisper для преобразования в текст и автоматически возвращает готовую транскрипцию обратно в чат. Должна работать на любой конфигурации 1С. Пригодится для энтузиастов и разработчиков интеграций 1С и ИИ.

1 стартмани

25.11.2025    1024    3    marat987654321    3    

3
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. PORGY3000 51 14.03.26 17:01 Сейчас в теме
Удалось сравнить 3070 и 5080 на разных серверах. Вот скрин.
Получается примерно в 4-5 раз быстрее 5080.
Прикрепленные файлы:
2. PORGY3000 51 14.03.26 17:01 Сейчас в теме
Удалось сравнить 3070 и 5080 на разных серверах. Вот скрин.
Получается примерно в 4-5 раз быстрее 5080.
Прикрепленные файлы:
3. PORGY3000 51 15.03.26 16:41 Сейчас в теме
Дополнение

В коде есть несколько вызовов глобальных процедур — они нужны только для вставки данных в уже открытые документы или через буфер. При необходимости их можно просто закомментировать.

Большая часть логики находится внутри обработки.

Почему используется именно LM Studio:

У нее есть нормальный API и она умеет принимать изображения. С другими инструментами с этим часто возникают сложности.

Почему выбрана модель mradermacher/next-ocr:

Это единственная модель из протестированных, которая дает приемлемое качество за разумное время.
Она реже «галлюцинирует» — не придумывает данные и не искажает их, как многие другие модели.

Самое важное — она выдает одинаковый результат на один и тот же файл.
Многие другие модели начинают давать разные ответы, путать данные или что‑то додумывать. Всего было протестировано около 50 моделей.

Тестирование проводилось на видеокартах:

RTX 2070 Super — около 35 секунд
RTX 3070 — около 20 секунд
RTX 5080 — около 7 секунд

Важно учитывать, что в это время входит несколько этапов:

— преобразование PDF в изображение
— загрузка модели
— передача изображения модели
— обработка изображения самой моделью
— получение ответа обратно
4. PORGY3000 51 15.03.26 16:47 Сейчас в теме
Так же пробовал свои сканах отдавать платным ИИ (за деньги).

Я бы НЕ сказал что результат разительно отличается от локальных моделей.

В некоторых случаях даже немного хуже.

И учтем что ИИ "смотрит" на картинку поэтому понижать расширение ниже 200dpi - не стоит.
5. PORGY3000 51 16.03.26 19:59 Сейчас в теме
Удалось сравнить 3070 с 5090 (за пол ляма рублей) Итог неоднозначный.

По чистому времени ИИ в 8 раз. По общему времени в 4 раза.

(видимо передача картинки занимает не мало времени..)
Прикрепленные файлы:
6. PORGY3000 51 16.03.26 19:59 Сейчас в теме
Удалось сравнить 3070 с 5090 (за пол ляма рублей) Итог неоднозначный.

По чистому времени ИИ в 8 раз. По общему времени в 4 раза.

(видимо передача картинки занимает не мало времени..)
Прикрепленные файлы:
Для отправки сообщения требуется регистрация/авторизация