А мы все видим

17.02.25

Интеграция - Нейросети

В библиотеке искусственного интеллекта для 1С появилась опция анализа изображения. Можно попросить большую языковую модель (LLM) выдать информацию на основании того, что она видит. Будет полезно познакомиться с тем, как это работает и что является best practice при работе с изображениями и LLM

Скачать файл

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование По подписке [?] Купить один файл
БиблиотекаИскусственногоИнтеллекта_v14(10)
.cfe 50,10Kb
2
2 Скачать (10 SM) Купить за 4 550 руб.
БиблиотекаИскусственногоИнтеллекта_v14(5)
.cfe 50,10Kb
4
4 Скачать (5 SM) Купить за 3 050 руб.
ПримерРаспознаванияУПД
.epf 6,71Kb
9
9 Скачать (1 SM) Купить за 1 850 руб.

Для работы нам понадобится Библиотека искусственного интеллекта для 1С. Она распространяется бесплатно, и, более того, под лицензией CC BY 4.0. Это означает, что вы можете использовать ее для создания своих коммерческих продуктов. Скачать бесплатно можно по ссылке выше. Но если у кого появится желание и возможность поблагодарить автора, тогда можно скачать ее здесь за стартмани.

Добавив опцию загрузки изображения в библиотеку, я стал экспериментировать. Как и положено 1С-нику, экспериментировал я ни с чем иным, как с УПД. Взял первый попавшийся документ в демонстрационной  базе Управление Торговлей ред. 11. Вывел на экран и сфотографировал, немного наклонив.

 

 

 

Изображение передается в формате base64. При этом, сначала идет префикс вида: "data:image/png;base64,", а затем собственно строка base64. В префиксе указывается формат изображения. Поддерживаются форматы PNG (.png), JPEG (.jpeg and .jpg), WEBP (.webp), non-animated GIF (.gif).

В расширении, содержащем библиотеку, есть также обработка "Библиотека искусственного интеллекта пример". Воспользуемся ею для экспериментов. Укажем путь к файлу изображения и зададим простой вопрос.

 

  

 

Теперь спросим что-нибудь сложнее

 

 

Что здесь считать строкой разобрались без проблем. Попробуем теперь получить ИНН продавца.

 

 

В общем ИИ неплохо ориентируется. Не путается в терминах "продавец"/"поставщик", ИНН от КПП отличает. Попробуем преобразовать это изображение в заданную нами структуру

 

 

 

В принципе, это работает, но до практического применения еще далеко. Если вы попробуете воспользоваться этим вот так просто, что называется "в лоб", тогда вам надо будет написать парсер для полученного ответа. Это только кажется относительно простой задачей. На деле, она почти не решаемая. ИИ будет вам выдавать правильные по сути структуры. Но по форме они будут время от времени "плавать", например так:

 

 

В state-of-art моделях предусмотрена опция response_format для того, чтобы задавать фиксированный формат ответа. Я добавил поддержку этой опции в версию 14 библиотеки. Зададим JSON-схему ответа.

 

 

Посмотрим, что у нас получится в ответе. Обратите внимание на то, что я оставил вопрос пользователя пустым. В данной ситуации он не нужен. Модели и так понятно, что надо преобразовать картинку в JSON. Что бы вы ни написали в поле "вопрос" результат будем один и тот, же. Поэтому не будем зря тратить входные токены.

 

 

Вот мы и получили на выходе JSON структуру, соответствующий заданной нами схеме. Дальше можете делать с ней что хотите. Например, создавать документы в базе данных (ПТиУ или РТиУ).

Обработка "Библиотека искусственного интеллекта пример" более или менее универсальна. Для решения рассматриваемой здесь задачи она будет избыточна. Поэтому я сделал заготовку, в которой нет ничего лишнего

 

   

 

Превращение потока в структуру, будь то голос, письменная речь или картинка - одна из важнейших, если не самая важная способность больших языковых моделей. А умение правильно использовать данную способность - одно из важнейших, если не самое важное сейчас качество разработчика.  

Проверено на следующих конфигурациях и релизах:

  • Управление торговлей, редакция 11, релизы 11.5.20.101

искусственный интеллект распознавание документов

См. также

Нейросети Мастера заполнения Платформа 1С v8.3 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 Платные (руб)

Расширение для заполнения описания номенклатуры с помощью модели ИИ GigaChat от Сбера. Расширение формирует продающее описание товара по его наименованию с помощью модели искусственного интеллекта. Будет полезно для владельцев интернет магазинов, каталогов товаров и продающих через маркетплейсы. Адаптировано для основных конфигураций: УТ, ЕРП, КА, УНФ.

5000 руб.

08.11.2023    4013    15    0    

25

Нейросети Анализ продаж Пользователь Платформа 1С v8.3 1С:Управление торговлей 11 Абонемент ($m)

Новая (портабельная) версия анализа продаж вместе с ИИ. Не требует установки расширения Библиотека искусственного интеллекта для 1С.

10 стартмани

17.06.2025    852    5    mkalimulin    6    

8

Управление инвестициями Нейросети Финансовые услуги, инвестиции Бесплатно (free)

Вплоть до текущего года я скептически относился к новостям о нейросетях. Мне казалось, что всё это просто очередной хайп и уж точно они не скоро смогут помочь в чём-то разработчику ПО. Но решил немного поэкспериментировать с пет-проектом, который пылился уже пару лет. Результат меня удивил, поэтому решил поделиться опытом с вами.

16.06.2025    2455    oyti    3    

5

Нейросети Инструментарий разработчика Программист Платформа 1С v8.3 Абонемент ($m)

Для эффективного использования современных LLM им не хватает контекста об 1С, как минимум, знания структуры метаданных 1С, а еще лучше знаний БСП и синтакс-помощника :) Технология MCP помогает решать эту проблему. Под катом описание MVP-решения, которое можно далее дорабатывать под себя. Мне сильно не хватало подобной статьи, чтобы сэкономить бессонные ночи.

1 стартмани

16.06.2025    4545    13    FSerg    13    

40

Нейросети Россия Абонемент ($m)

Нейросетями становится пользоваться все удобнее и интереснее. Правильное применение инструмента помогает сэкономить много времени сил и сосредоточиться на творчестве, а не на рутине.

1 стартмани

11.06.2025    442    Ликреонский    9    

0

Нейросети Программист 1С:Библиотека стандартных подсистем Бесплатно (free)

Рассмотрим Claude Sonnet 4, GPT o3 и 4.1, Qwen3, Llama 4 Maverick, Grok. Cursor и плагин для EDT.

28.05.2025    6515    comol    39    

37

Нейросети Платформа 1С v8.3 1С:Управление торговлей 11 Платные (руб)

ИИ престиж это уникальное готовое решение для того, чтобы начать применять современные технологии искусственного интеллекта в вашей учетной системе и сразу получать выраженный экономический эффект. Для этого вам не надо будет отказываться от устоявшихся практик. ИИ престиж дополнит вашу рабочую систему инструментами, операторами, агентами на базе искусственного интеллекта. Вы получите учетную систему совершенно другого уровня, которую вы сможете развивать в нужном направлении.

600000 руб.

23.05.2025    1967    0    0    

1
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. Xershi 1532 18.02.25 02:29 Сейчас в теме
Если на вход подать пдф файл. Отработает?
Светлый ум; +1 Ответить
5. mkalimulin 1538 18.02.25 10:53 Сейчас в теме
(1) Поддерживаются форматы PNG (.png), JPEG (.jpeg and .jpg), WEBP (.webp), non-animated GIF (.gif).
Для работы с PDF надо использовать механизм Assistant. Про него тоже как-нибудь напишу.
9. Xershi 1532 18.02.25 11:46 Сейчас в теме
(5) да, будет больше пользы. Поставщики любят в пдф отправлять счета и прочие документы. Переводить их в картинку тот ещё квест.
2. bashirov.rs 31 18.02.25 08:14 Сейчас в теме
Интересно. Есть к примеру задача проверить правильный ли скан документа грузят в базу. Можно ли проверить через ИИ задав вопрос - "Соответствует ли файл шаблону?" или "Похож ли файл на образец?", где далее дать сравнивать с макетом файла из базы? Отработает?
8. mkalimulin 1538 18.02.25 11:04 Сейчас в теме
(2) Да, и у этой задачи есть как минимум два решения. Можно получать эмбеддинги (векторные представления) изображений и сравнивать. Для этого не надо задействовать большие языковые модели. А можно действовать через запрос к большой языковой модели. Первый вариант будет существенно дешевле
starik-2005; +1 Ответить
3. akR00b 25 18.02.25 09:29 Сейчас в теме
Ссылка на библиотеку не работает, публикация на модерации.
6. mkalimulin 1538 18.02.25 10:54 Сейчас в теме
4. dasan92 12 18.02.25 10:18 Сейчас в теме
Интересен примерный ценник обработки 1к УПД, без учета работ разарботчика, только запросы к модели?
7. mkalimulin 1538 18.02.25 10:58 Сейчас в теме
(4) Рублей 20, если самую экономную модель использовать и каждый документ распознавать один раз. Для надежности лучше распознавать два раза, иногда три, когда первые два не совпали. Тогда это будет около 40 рублей за тысячу документов.
10. o.nikolaev 217 19.02.25 15:39 Сейчас в теме
11. o.nikolaev 217 19.02.25 15:41 Сейчас в теме
:) Какие будут чувства когда на вопрос "что ты видишь" от модели будет получен ответ "я вижу смутный силуэт человека сидящего за компьютером" :))
maksa2005; +1 Ответить
Оставьте свое сообщение