А мы все видим

17.02.25

Интеграция - Нейросети

В библиотеке искусственного интеллекта для 1С появилась опция анализа изображения. Можно попросить большую языковую модель (LLM) выдать информацию на основании того, что она видит. Будет полезно познакомиться с тем, как это работает и что является best practice при работе с изображениями и LLM

Скачать файл

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование По подписке [?] Купить один файл
БиблиотекаИскусственногоИнтеллекта_v14(10)
.cfe 50,10Kb
0
0 Скачать (10 SM) Купить за 4 550 руб.
БиблиотекаИскусственногоИнтеллекта_v14(5)
.cfe 50,10Kb
3
3 Скачать (5 SM) Купить за 3 050 руб.
ПримерРаспознаванияУПД
.epf 6,71Kb
3
3 Скачать (1 SM) Купить за 1 850 руб.

Для работы нам понадобится Библиотека искусственного интеллекта для 1С. Она распространяется бесплатно, и, более того, под лицензией CC BY 4.0. Это означает, что вы можете использовать ее для создания своих коммерческих продуктов. Скачать бесплатно можно по ссылке выше. Но если у кого появится желание и возможность поблагодарить автора, тогда можно скачать ее здесь за стартмани.

Добавив опцию загрузки изображения в библиотеку, я стал экспериментировать. Как и положено 1С-нику, экспериментировал я ни с чем иным, как с УПД. Взял первый попавшийся документ в демонстрационной  базе Управление Торговлей ред. 11. Вывел на экран и сфотографировал, немного наклонив.

 

 

 

Изображение передается в формате base64. При этом, сначала идет префикс вида: "data:image/png;base64,", а затем собственно строка base64. В префиксе указывается формат изображения. Поддерживаются форматы PNG (.png), JPEG (.jpeg and .jpg), WEBP (.webp), non-animated GIF (.gif).

В расширении, содержащем библиотеку, есть также обработка "Библиотека искусственного интеллекта пример". Воспользуемся ею для экспериментов. Укажем путь к файлу изображения и зададим простой вопрос.

 

  

 

Теперь спросим что-нибудь сложнее

 

 

Что здесь считать строкой разобрались без проблем. Попробуем теперь получить ИНН продавца.

 

 

В общем ИИ неплохо ориентируется. Не путается в терминах "продавец"/"поставщик", ИНН от КПП отличает. Попробуем преобразовать это изображение в заданную нами структуру

 

 

 

В принципе, это работает, но до практического применения еще далеко. Если вы попробуете воспользоваться этим вот так просто, что называется "в лоб", тогда вам надо будет написать парсер для полученного ответа. Это только кажется относительно простой задачей. На деле, она почти не решаемая. ИИ будет вам выдавать правильные по сути структуры. Но по форме они будут время от времени "плавать", например так:

 

 

В state-of-art моделях предусмотрена опция response_format для того, чтобы задавать фиксированный формат ответа. Я добавил поддержку этой опции в версию 14 библиотеки. Зададим JSON-схему ответа.

 

 

Посмотрим, что у нас получится в ответе. Обратите внимание на то, что я оставил вопрос пользователя пустым. В данной ситуации он не нужен. Модели и так понятно, что надо преобразовать картинку в JSON. Что бы вы ни написали в поле "вопрос" результат будем один и тот, же. Поэтому не будем зря тратить входные токены.

 

 

Вот мы и получили на выходе JSON структуру, соответствующий заданной нами схеме. Дальше можете делать с ней что хотите. Например, создавать документы в базе данных (ПТиУ или РТиУ).

Обработка "Библиотека искусственного интеллекта пример" более или менее универсальна. Для решения рассматриваемой здесь задачи она будет избыточна. Поэтому я сделал заготовку, в которой нет ничего лишнего

 

   

 

Превращение потока в структуру, будь то голос, письменная речь или картинка - одна из важнейших, если не самая важная способность больших языковых моделей. А умение правильно использовать данную способность - одно из важнейших, если не самое важное сейчас качество разработчика.  

Проверено на следующих конфигурациях и релизах:

  • Управление торговлей, редакция 11, релизы 11.5.20.101

искусственный интеллект распознавание документов

См. также

Нейросети 8.3.6 1С:Управление торговлей 11 Управленческий учет Платные (руб)

Обработка подключения фотокамер Canon и Nikon к Управление торговлей 11.4 для потоковой загрузки фотографий в карточки товаров с автоматическим удалением фона

22800 руб.

24.06.2021    10125    4    4    

15

Нейросети Мастера заполнения Платформа 1С v8.3 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 Платные (руб)

Расширение для заполнения описания номенклатуры с помощью модели ИИ GigaChat от Сбера. Расширение формирует продающее описание товара по его наименованию с помощью модели искусственного интеллекта. Будет полезно для владельцев интернет магазинов, каталогов товаров и продающих через маркетплейсы. Адаптировано для основных конфигураций: УТ, ЕРП, КА, УНФ.

5000 руб.

08.11.2023    3093    13    0    

22

Мастера заполнения Нейросети Платформа 1С v8.3 1C:Бухгалтерия 1С:Управление торговлей 11 Платные (руб)

Расширение для заполнения описания товара (номенклатуры) с помощью модели ИИ ChatGPT с ключевыми словами. Расширение формирует продающее описание товара по его наименованию с помощью модели искусственного интеллекта. Будет полезно для владельцев интернет магазинов, каталогов товаров и продающих через маркетплейсы. Адаптировано для основных конфигураций: УТ, ЕРП, КА, УНФ. Прошло аудит на 1cfresh.com. Версия для автоматического заполнения

5000 руб.

13.03.2023    18782    47    50    

77

Нейросети Бесплатно (free)

В этой статье расскажу, какие задачи можно и даже нужно делегировать искусственному интеллекту, в чём трудности применения Chat GPT в России. Попробуем составить полноценное ТЗ для создания мобильного приложения на базе 1С:Предприятие с помощью ИИ и сервиса MAKER-STUDIO.

14.02.2025    648    1Concept    0    

3

Нейросети Программист Пользователь Абонемент ($m)

Вам нравится набирать сообщения и другую информацию в телефоне голосом? Вы хотите делать то же самое на компьютере? С помощью голосового ввода Вы можете упростить работу с текстом на компьютере, транскрибируя речь в реальном времени с SimpleVoiceInput.

3 стартмани

12.02.2025    543    8    Smikle    2    

8

Нейросети Распознавание документов и образов Программист Платформа 1С v8.3 Отраслевые Бесплатно (free)

Пример использования механизма голосового распознавания платформы 1С: Предприятия на примере Демоприложения речевого распознавания от 1С с примером добавленной библиотеки ИИ от Михаила Калимулина с интегрированным голосовым управлением для формирования текста запроса к ИИ.

07.02.2025    443    24    m_aster    2    

6

Нейросети Бесплатно (free)

Искусственный интеллект постепенно становится неотъемлемой частью нашей жизни, ускоряя и упрощая рутинные процессы. Но ИИ – это не замена сотрудника, а лишь инструмент. Расскажем о применении дообученного ChatGPT для основных задач аналитиков: составления глоссария, моделирования процессов и User Story Mapping.

04.02.2025    1606    alenkaiva    0    

11

Нейросети Программист Платформа 1С v8.3 Бесплатно (free)

Год назад я покупал доступ к CoPilot, чтобы рассмотреть возможность ускорения разработки на 1С. Однако, я столкнулся с проблемой, что CoPilot отвратительно работает с кодом на языке 1С. Он не знал синтаксиса абсолютно...

04.02.2025    2635    huxuxuya    15    

14
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. Xershi 1262 18.02.25 02:29 Сейчас в теме
Если на вход подать пдф файл. Отработает?
Светлый ум; +1 Ответить
5. mkalimulin 1366 18.02.25 10:53 Сейчас в теме
(1) Поддерживаются форматы PNG (.png), JPEG (.jpeg and .jpg), WEBP (.webp), non-animated GIF (.gif).
Для работы с PDF надо использовать механизм Assistant. Про него тоже как-нибудь напишу.
9. Xershi 1262 18.02.25 11:46 Сейчас в теме
(5) да, будет больше пользы. Поставщики любят в пдф отправлять счета и прочие документы. Переводить их в картинку тот ещё квест.
2. bashirov.rs 31 18.02.25 08:14 Сейчас в теме
Интересно. Есть к примеру задача проверить правильный ли скан документа грузят в базу. Можно ли проверить через ИИ задав вопрос - "Соответствует ли файл шаблону?" или "Похож ли файл на образец?", где далее дать сравнивать с макетом файла из базы? Отработает?
8. mkalimulin 1366 18.02.25 11:04 Сейчас в теме
(2) Да, и у этой задачи есть как минимум два решения. Можно получать эмбеддинги (векторные представления) изображений и сравнивать. Для этого не надо задействовать большие языковые модели. А можно действовать через запрос к большой языковой модели. Первый вариант будет существенно дешевле
starik-2005; +1 Ответить
3. akR00b 24 18.02.25 09:29 Сейчас в теме
Ссылка на библиотеку не работает, публикация на модерации.
6. mkalimulin 1366 18.02.25 10:54 Сейчас в теме
4. dasan92 12 18.02.25 10:18 Сейчас в теме
Интересен примерный ценник обработки 1к УПД, без учета работ разарботчика, только запросы к модели?
7. mkalimulin 1366 18.02.25 10:58 Сейчас в теме
(4) Рублей 20, если самую экономную модель использовать и каждый документ распознавать один раз. Для надежности лучше распознавать два раза, иногда три, когда первые два не совпали. Тогда это будет около 40 рублей за тысячу документов.
10. o.nikolaev 216 19.02.25 15:39 Сейчас в теме
11. o.nikolaev 216 19.02.25 15:41 Сейчас в теме
:) Какие будут чувства когда на вопрос "что ты видишь" от модели будет получен ответ "я вижу смутный силуэт человека сидящего за компьютером" :))
maksa2005; +1 Ответить
Оставьте свое сообщение