RAG, два, три

01.04.25

Интеграция - Нейросети

В библиотеке искусственного интеллекта для 1С появилась поддержка RAG (Retrieval Augmented Generation). Что это такое и как с этим работать, рассказываю в этой статье.

Бесплатные

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование Скачано Бесплатно
kolobok.txt
.txt 4,18Kb
57 Скачать бесплатно

Для работы вам понадобится Библиотека искусственного интеллекта для 1С.  Она распространяется бесплатно и вы можете использовать ее для создания своих коммерческих продуктов.

Когда клиенты заводят разговор о RAG, довольно часто приходится слышать об "обучении нейросетей". Дескать, давайте обучим нейросеть нашими данными с помощью RAG. Строго говоря, это неправильно. Обучение нейросетей, это отдельная сложная тема, а с RAG все несколько проще.

Представим, что мы хотим давать ответы на вопросы клиентов, задействовав для этого искусственный интеллект. Мы берем большую и умную нейросеть. Ее уже обучили всему, чему надо и она может поддерживать непринужденный разговор. Но вот конкретно про нас она не знает ничего, или почти ничего. Клиент приходит с простым вопросом: какой у вас график работы? Нам нужно сделать что-то, чтобы нейросеть смогла ответить на него. Для этого ее не надо обучать. Можно поступить проще. Добавить ответ в вопрос. Это и будет тем самым augment, т.е. расширением.

Вопрос клиента:

Какой у вас график работы?

Наше расширение:

Мы работаем по будням, с 9:00 до 18:00 

Что получает на вход нейросеть:

Мы работаем по будням, с 9:00 до 18:00 Какой у вас график работы? 

Понятно, что получив такой вопрос, нейросеть даст на него верный ответ. Разумеется, мы не станем ограничивать себя ответом на один-единственный вопрос. В наше расширение мы загрузим вообще все, что посчитаем нужным так или иначе сообщать клиенту: перечень товаров и услуг, порядок работы, инструкции и т.д.

Здесь и проявляется сила нейросети. Она без проблем найдет в этой массе информации именно то, что нужно для ответа на конкретный вопрос. Но есть одна техническая сложность. Размер этой самой "массы" сильно ограничен. 

Во-первых, есть размер контекста. У разных моделей он разный. У gpt-4o от OpenAI это 128К токенов. У Claude Sonnet 3.7 от Anthropic 200K. У Gemini 2.5 pro от Google 1 миллион токенов и обещают 2 вскорости. Миллион токенов, это достаточно много. Практически "Война и мир" (на английском языке около 700К токенов). Но существует мнение, что с увеличением контекста качество ответов падает. Так что, миллион токенов, это только в теории. На практике и 32К уже многовато. Потому еще, что во-вторых, есть плата за входящие токены. У gpt-4o сейчас 2.5$ за миллион токенов, у Sonnet 3.7 это 3$. Платить по 10 рублей за каждую реплику в диалоге с клиентом может оказаться накладным.

И вот тут возникает идея подмешивать в запрос пользователя не все-все-все, а только то, что имеет отношение к этому запросу. Как определить, что имеет отношение к запросу пользователя? И тут на помощь приходит нейросеть. Она умеет превращать текст в вектор (embedding). Вектор, это много чисел, например 512. А по сути, точка в 512-мерном пространстве. Теперь мы можем разделить наш большой текст, в котором все-все-все, на маленькие части. Для каждой части получим вектор или точку в 512-мерном пространстве. Далее, получив от пользователя запрос, мы и для него рассчитаем точку и определим к какой из ранее рассчитанных точек она ближе всего. Так мы получим ту самую часть большого текста, которую надо добавить в запрос.

Конечно, трудно себе представить 512-мерное пространство, но работает это прекрасно. А еще более прекрасно то, что в Response API от OpenAI (как и в скоропостижно устаревшем Assistant API) вся эта сложная работа с векторной базой скрыта "под капотом". Вы создаете векторную базу одной простой командой, загружаете туда файл или файлы (это не важно, все равно все будет порезано на кусочки неким оптимальным способом). И все готово к работе. Все что нам нужно для того, чтобы заработало "подмешивание", это указать id векторной базы в специально выделенной для этого опции.

 

В библиотеке искусственного интеллекта для 1С, начиная с версии 19, появились функции: СоздатьВекторнуюБазу(), ЗагрузитьФайл(), РазместитьФайл()

 

   

  

В результате мы получаем подготовленную векторную базу с неким id. Этот id мы передаем в опции "vector_store_id" и получаем RAG.

Вы можете самостоятельно поэкспериментировать с этим, пользуясь обработкой БИИ_Пример, которая входит в состав библиотеки.

 

 

 

Файл kolobok.txt, на котором  экспериментировал я, прилагаю.

Как видите, RAG относительно простая вещь. А с библиотекой искусственного интеллекта для 1С это становится просто, как раз-два-три.

Вступайте в нашу телеграмм-группу Инфостарт

См. также

Администрирование веб-серверов Сервера Нейросети Программист Платные (руб)

Сервер поиска по метаданным и поиска по коду, Сервер экспорта и поиска по документации, Сервер синтаксической проверки кода

6000 руб.

17.06.2025    11517    114    18    

49

Нейросети 1С v8.3 Платные (руб)

Подключите Вашу 1С к ИИ. Расширение практически для любых конфигураций 1С, которое добавляет к ним MCP серверы и позволяет делать свои инструменты (tools), которые могут вызывать любые нейросетевые модели.

12000 руб.

10.07.2025    1982    2    2    

6

Нейросети Пользователь 1С v8.3 1С:Управление нашей фирмой 1.6 1С:Управление торговлей 11 1С:Управление нашей фирмой 3.0 Оптовая торговля, дистрибуция, логистика Россия Управленческий учет Платные (руб)

Расширение "Искусственный интеллект и нейросети в 1С: Работа с отзывами маркетплейсов" предназначено для применения искусственного интеллекта в повседневной деятельности селлеров на маркетплейсах. Среди функций - работа с отзывами, вопросами и чатами покупателей, диалог с нейросетями, генерация картинок, заполнение описаний номенклатуры и другое.

6000 руб.

03.04.2024    9388    5    0    

9

Нейросети Мастера заполнения 1С v8.3 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 Платные (руб)

Расширение для заполнения описания номенклатуры с помощью модели ИИ GigaChat от Сбера. Расширение формирует продающее описание товара по его наименованию с помощью модели искусственного интеллекта. Будет полезно для владельцев интернет магазинов, каталогов товаров и продающих через маркетплейсы. Адаптировано для основных конфигураций: УТ, ЕРП, КА, УНФ.

5000 руб.

08.11.2023    4624    17    0    

27

Мастера заполнения Нейросети 1С v8.3 1C:Бухгалтерия 1С:Управление торговлей 11 Платные (руб)

Расширение для заполнения описания товара (номенклатуры) с помощью модели ИИ ChatGPT с ключевыми словами. Расширение формирует продающее описание товара по его наименованию с помощью модели искусственного интеллекта. Будет полезно для владельцев интернет магазинов, каталогов товаров и продающих через маркетплейсы. Адаптировано для основных конфигураций: УТ, ЕРП, КА, УНФ. Прошло аудит на 1cfresh.com. Версия для автоматического заполнения

5000 руб.

13.03.2023    20345    49    50    

78

Нейросети Бесплатно (free)

Как-то мимо многих моих коллег прошла статья Инфостарта про ИИ Бота-консультанта 1С по ИТС. А я им пользуюсь! Находя на свои вопросы чайника вполне сносные ответы, помогающие быстро разруливать рутину терминов тех. заданий и запутанных вопросов от Заказчика.

12.08.2025    6175    sapervodichka    38    

45

Нейросети Программист 1С v8.3 Бесплатно (free)

Так получилось, что нейросети крепко вошли в современную жизнь, но 1С с ними почти не работает, да и публикаций от разработчиков не так чтобы очень много. Хотя, казалось бы, польза от ИИ достаточно очевидна. Поэтому решил из энтузиазма и палок собрать дешёвое, функциональное решение. Взял почти бесплатный Deepseek и с помощью интеграционных костылей внедрил его в систему взаимодействия.

04.08.2025    7641    trim89    6    

15

Нейросети Тестирование QA Программист Бесплатно (free)

Искусственный интеллект меняет подход к тестированию в 1С, делая его быстрее и удобнее для разработчиков любого уровня. Из этой статьи вы узнаете, как кастомная модель GPT, обученная на специализированных данных по 1С, генерирует тесты с учетом особенностей платформы. Разберем ключевые преимущества: сокращение времени на создание тестов, автоматизацию рутины и повышение точности. А также покажем реальные примеры внедрения ИИ-ассистента, отзывы пользователей и перспективы развития автоматизированного тестирования с помощью нейросетей.

04.08.2025    1094    plekhanov    1    

11
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. JohnyDeath 302 01.04.25 14:31 Сейчас в теме
Сколько в итоге токенов будет уходить на RAG? Понятно, что обращение к модели будет дешевле, но непонятно на сколько. Что будет-таки уходить в облако и какими порциями? От чего зависит размер этих порций?

Спасибо за библиотеку. Периодически подсматриваю там кусочки и что-то тестирую
cleaner_it; +1 Ответить
2. mkalimulin 1555 01.04.25 15:10 Сейчас в теме
(1) В моем примере получилось около 3000 токенов. Но я ставлю параметры auto при создании векторной базы. В принципе, можно играться размерами чанка (кусочка, chunk) и размерами перекрытия. Response API такое предусматривает. Меньше размеры, меньше токенов, но и качество ответов при этом может снижаться, поэтому оставил auto
cleaner_it; JohnyDeath; fatman78; +3 Ответить
3. vlad1976 01.04.25 18:33 Сейчас в теме
душу только травите. мне база досталась в режиме совместимости 8.3.12. и уже ваше расширение не поставить.
4. mkalimulin 1555 01.04.25 18:36 Сейчас в теме
(3) Так. А в чем загвоздка? JSON, насколько помню с 8.3.6, HTTP еще раньше. Что не дает поставить?
5. vlad1976 01.04.25 19:11 Сейчас в теме
Конфигурация.БиблиотекаИскусственногоИнтеллекта: Переопределение свойств заимствованных объектов в расширениях недопустимо в режиме совместимости 8.3.13 и ниже
6. mkalimulin 1555 01.04.25 19:35 Сейчас в теме
(5) Думаю, это можно будет убрать. Попробую в следующей версии
cleaner_it; +1 Ответить
7. timeforlive 16 02.04.25 10:28 Сейчас в теме
Думал 1 апрельская шутка этот пост. Спасибо, что осветили такой инструмент, буду пробовать.
8. mkalimulin 1555 02.04.25 11:00 Сейчас в теме
(7) Да, я что-то поздно спохватился. Совсем забыл, что 1 апреля надо публиковать либо ничего, либо веселое
9. Ndochp 104 04.04.25 12:56 Сейчас в теме
А векторная база на чем делается?
Вообще кажется что с использованием RAG мы начинаем очень слабо зависеть от ЛЛМ. Кажется токенами платим за "перескажи вывод поиска". А я точно дешевле лично не справлюсь с чтением ответа векторной базы?
10. mkalimulin 1555 04.04.25 13:12 Сейчас в теме
(9) Чтобы превратить текст в вектор нужна нейросеть. Это основной момент. А собственно векторная база играет вспомогательную роль. Просто очень быстро считает расстояния между векторами
11. Ndochp 104 04.04.25 16:35 Сейчас в теме
(10) Наш АИотдел говорит, что в вектор надо класть куски размером 1500 символов с 50% перекрытием и будет счастье. А нейросетка значит нужна чтобы этим кускам сопоставить вектора? Вот этот момент я походу и пропускал. Думал что операцию "докинь еще вот этот кусок" векторная база делает без LLM.
12. mkalimulin 1555 04.04.25 16:39 Сейчас в теме
(11) Ну, да. А раз уж все равно обращаешься к нейросети не локально, то зачем тебе своя векторная база?
13. mikukrnet 182 23.07.25 12:12 Сейчас в теме
Подкинул обработке список сотрудников с подразделениям, поспрашивал - отвечает норм, но каждый раз весь текст списывает за счет токенов. На каких объемах уже включится RAG и начнет давать свою экономию?
14. mkalimulin 1555 23.07.25 14:50 Сейчас в теме
(13) Каждый случай индивидуален, но обычно считается, что до 50 страниц текста RAG избыточен.
Оставьте свое сообщение