RAG, два, три

01.04.25

В библиотеке искусственного интеллекта для 1С появилась поддержка RAG (Retrieval Augmented Generation). Что это такое и как с этим работать, рассказываю в этой статье.

Бесплатные

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование	Скачано	Бесплатно
kolobok.txt .txt 4,18Kb 57	57	Скачать бесплатно

Для работы вам понадобится Библиотека искусственного интеллекта для 1С. Она распространяется бесплатно и вы можете использовать ее для создания своих коммерческих продуктов.

Когда клиенты заводят разговор о RAG, довольно часто приходится слышать об "обучении нейросетей". Дескать, давайте обучим нейросеть нашими данными с помощью RAG. Строго говоря, это неправильно. Обучение нейросетей, это отдельная сложная тема, а с RAG все несколько проще.

Представим, что мы хотим давать ответы на вопросы клиентов, задействовав для этого искусственный интеллект. Мы берем большую и умную нейросеть. Ее уже обучили всему, чему надо и она может поддерживать непринужденный разговор. Но вот конкретно про нас она не знает ничего, или почти ничего. Клиент приходит с простым вопросом: какой у вас график работы? Нам нужно сделать что-то, чтобы нейросеть смогла ответить на него. Для этого ее не надо обучать. Можно поступить проще. Добавить ответ в вопрос. Это и будет тем самым augment, т.е. расширением.

Вопрос клиента:

Какой у вас график работы?

Наше расширение:

Мы работаем по будням, с 9:00 до 18:00

Что получает на вход нейросеть:

Мы работаем по будням, с 9:00 до 18:00 Какой у вас график работы?

Понятно, что получив такой вопрос, нейросеть даст на него верный ответ. Разумеется, мы не станем ограничивать себя ответом на один-единственный вопрос. В наше расширение мы загрузим вообще все, что посчитаем нужным так или иначе сообщать клиенту: перечень товаров и услуг, порядок работы, инструкции и т.д.

Здесь и проявляется сила нейросети. Она без проблем найдет в этой массе информации именно то, что нужно для ответа на конкретный вопрос. Но есть одна техническая сложность. Размер этой самой "массы" сильно ограничен.

Во-первых, есть размер контекста. У разных моделей он разный. У gpt-4o от OpenAI это 128К токенов. У Claude Sonnet 3.7 от Anthropic 200K. У Gemini 2.5 pro от Google 1 миллион токенов и обещают 2 вскорости. Миллион токенов, это достаточно много. Практически "Война и мир" (на английском языке около 700К токенов). Но существует мнение, что с увеличением контекста качество ответов падает. Так что, миллион токенов, это только в теории. На практике и 32К уже многовато. Потому еще, что во-вторых, есть плата за входящие токены. У gpt-4o сейчас 2.5$ за миллион токенов, у Sonnet 3.7 это 3$. Платить по 10 рублей за каждую реплику в диалоге с клиентом может оказаться накладным.

И вот тут возникает идея подмешивать в запрос пользователя не все-все-все, а только то, что имеет отношение к этому запросу. Как определить, что имеет отношение к запросу пользователя? И тут на помощь приходит нейросеть. Она умеет превращать текст в вектор (embedding). Вектор, это много чисел, например 512. А по сути, точка в 512-мерном пространстве. Теперь мы можем разделить наш большой текст, в котором все-все-все, на маленькие части. Для каждой части получим вектор или точку в 512-мерном пространстве. Далее, получив от пользователя запрос, мы и для него рассчитаем точку и определим к какой из ранее рассчитанных точек она ближе всего. Так мы получим ту самую часть большого текста, которую надо добавить в запрос.

Конечно, трудно себе представить 512-мерное пространство, но работает это прекрасно. А еще более прекрасно то, что в Response API от OpenAI (как и в скоропостижно устаревшем Assistant API) вся эта сложная работа с векторной базой скрыта "под капотом". Вы создаете векторную базу одной простой командой, загружаете туда файл или файлы (это не важно, все равно все будет порезано на кусочки неким оптимальным способом). И все готово к работе. Все что нам нужно для того, чтобы заработало "подмешивание", это указать id векторной базы в специально выделенной для этого опции.

В библиотеке искусственного интеллекта для 1С, начиная с версии 19, появились функции: СоздатьВекторнуюБазу(), ЗагрузитьФайл(), РазместитьФайл()

В результате мы получаем подготовленную векторную базу с неким id. Этот id мы передаем в опции "vector_store_id" и получаем RAG.

Вы можете самостоятельно поэкспериментировать с этим, пользуясь обработкой БИИ_Пример, которая входит в состав библиотеки.

Файл kolobok.txt, на котором экспериментировал я, прилагаю.

Как видите, RAG относительно простая вещь. А с библиотекой искусственного интеллекта для 1С это становится просто, как раз-два-три.

Вступайте в нашу телеграмм-группу Инфостарт

+36 –

См. также

MCP серверы для вайб кодинга в 1С

Администрирование веб-серверов Сервера Нейросети Программист Платные (руб)

Сервер поиска по метаданным и поиска по коду, Сервер экспорта и поиска по документации, Сервер синтаксической проверки кода

6000 руб.

17.06.2025 11488 114 18

Конструктор MCP серверов для 1С

Нейросети 1С v8.3 Платные (руб)

Подключите Вашу 1С к ИИ. Расширение практически для любых конфигураций 1С, которое добавляет к ним MCP серверы и позволяет делать свои инструменты (tools), которые могут вызывать любые нейросетевые модели.

12000 руб.

10.07.2025 1979 2 2

Искусственный интеллект и нейросети в 1С: Работа с отзывами маркетплейсов

Нейросети Пользователь 1С v8.3 1С:Управление нашей фирмой 1.6 1С:Управление торговлей 11 1С:Управление нашей фирмой 3.0 Оптовая торговля, дистрибуция, логистика Россия Управленческий учет Платные (руб)

Расширение "Искусственный интеллект и нейросети в 1С: Работа с отзывами маркетплейсов" предназначено для применения искусственного интеллекта в повседневной деятельности селлеров на маркетплейсах. Среди функций - работа с отзывами, вопросами и чатами покупателей, диалог с нейросетями, генерация картинок, заполнение описаний номенклатуры и другое.

6000 руб.

03.04.2024 9382 5 0

Заполнение описания номенклатуры с помощью GigaChat

Нейросети Мастера заполнения 1С v8.3 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 Платные (руб)

Расширение для заполнения описания номенклатуры с помощью модели ИИ GigaChat от Сбера. Расширение формирует продающее описание товара по его наименованию с помощью модели искусственного интеллекта. Будет полезно для владельцев интернет магазинов, каталогов товаров и продающих через маркетплейсы. Адаптировано для основных конфигураций: УТ, ЕРП, КА, УНФ.

5000 руб.

08.11.2023 4622 17 0

Чат GPT описание товара: составить описание номенклатуры с помощью ChatGPT с ключевыми словами

Мастера заполнения Нейросети 1С v8.3 1C:Бухгалтерия 1С:Управление торговлей 11 Платные (руб)

Расширение для заполнения описания товара (номенклатуры) с помощью модели ИИ ChatGPT с ключевыми словами. Расширение формирует продающее описание товара по его наименованию с помощью модели искусственного интеллекта. Будет полезно для владельцев интернет магазинов, каталогов товаров и продающих через маркетплейсы. Адаптировано для основных конфигураций: УТ, ЕРП, КА, УНФ. Прошло аудит на 1cfresh.com. Версия для автоматического заполнения

5000 руб.

13.03.2023 20343 49 50

ИИ ИТС бот-консультант https://portalchat.1c.ai/

Нейросети Бесплатно (free)

Как-то мимо многих моих коллег прошла статья Инфостарта про ИИ Бота-консультанта 1С по ИТС. А я им пользуюсь! Находя на свои вопросы чайника вполне сносные ответы, помогающие быстро разруливать рутину терминов тех. заданий и запутанных вопросов от Заказчика.

12.08.2025 6164 sapervodichka 38

🚀 Deepseek + Система Взаимодействия = Шалость удалась!

Нейросети Программист 1С v8.3 Бесплатно (free)

Так получилось, что нейросети крепко вошли в современную жизнь, но 1С с ними почти не работает, да и публикаций от разработчиков не так чтобы очень много. Хотя, казалось бы, польза от ИИ достаточно очевидна. Поэтому решил из энтузиазма и палок собрать дешёвое, функциональное решение. Взял почти бесплатный Deepseek и с помощью интеграционных костылей внедрил его в систему взаимодействия.

04.08.2025 7638 trim89 6

Автоматизация написания тестов YaxUnit с помощью кастомной модели GPT

Нейросети Тестирование QA Программист Бесплатно (free)

Искусственный интеллект меняет подход к тестированию в 1С, делая его быстрее и удобнее для разработчиков любого уровня. Из этой статьи вы узнаете, как кастомная модель GPT, обученная на специализированных данных по 1С, генерирует тесты с учетом особенностей платформы. Разберем ключевые преимущества: сокращение времени на создание тестов, автоматизацию рутины и повышение точности. А также покажем реальные примеры внедрения ИИ-ассистента, отзывы пользователей и перспективы развития автоматизированного тестирования с помощью нейросетей.

04.08.2025 1091 plekhanov 1

Комментарии

Подписаться на ответы Инфостарт бот

Свернуть все

1. JohnyDeath 302 01.04.25 14:31 Сейчас в теме

Сколько в итоге токенов будет уходить на RAG? Понятно, что обращение к модели будет дешевле, но непонятно на сколько. Что будет-таки уходить в облако и какими порциями? От чего зависит размер этих порций?

Спасибо за библиотеку. Периодически подсматриваю там кусочки и что-то тестирую

2. mkalimulin 1555 01.04.25 15:10 Сейчас в теме

(1) В моем примере получилось около 3000 токенов. Но я ставлю параметры auto при создании векторной базы. В принципе, можно играться размерами чанка (кусочка, chunk) и размерами перекрытия. Response API такое предусматривает. Меньше размеры, меньше токенов, но и качество ответов при этом может снижаться, поэтому оставил auto

3. vlad1976 01.04.25 18:33 Сейчас в теме

душу только травите. мне база досталась в режиме совместимости 8.3.12. и уже ваше расширение не поставить.

4. mkalimulin 1555 01.04.25 18:36 Сейчас в теме

(3) Так. А в чем загвоздка? JSON, насколько помню с 8.3.6, HTTP еще раньше. Что не дает поставить?

5. vlad1976 01.04.25 19:11 Сейчас в теме

Конфигурация.БиблиотекаИскусственногоИнтеллекта: Переопределение свойств заимствованных объектов в расширениях недопустимо в режиме совместимости 8.3.13 и ниже

6. mkalimulin 1555 01.04.25 19:35 Сейчас в теме

(5) Думаю, это можно будет убрать. Попробую в следующей версии

7. timeforlive 16 02.04.25 10:28 Сейчас в теме

Думал 1 апрельская шутка этот пост. Спасибо, что осветили такой инструмент, буду пробовать.

8. mkalimulin 1555 02.04.25 11:00 Сейчас в теме

(7) Да, я что-то поздно спохватился. Совсем забыл, что 1 апреля надо публиковать либо ничего, либо веселое

9. Ndochp 104 04.04.25 12:56 Сейчас в теме

А векторная база на чем делается?
Вообще кажется что с использованием RAG мы начинаем очень слабо зависеть от ЛЛМ. Кажется токенами платим за "перескажи вывод поиска". А я точно дешевле лично не справлюсь с чтением ответа векторной базы?

10. mkalimulin 1555 04.04.25 13:12 Сейчас в теме

(9) Чтобы превратить текст в вектор нужна нейросеть. Это основной момент. А собственно векторная база играет вспомогательную роль. Просто очень быстро считает расстояния между векторами

11. Ndochp 104 04.04.25 16:35 Сейчас в теме

(10) Наш АИотдел говорит, что в вектор надо класть куски размером 1500 символов с 50% перекрытием и будет счастье. А нейросетка значит нужна чтобы этим кускам сопоставить вектора? Вот этот момент я походу и пропускал. Думал что операцию "докинь еще вот этот кусок" векторная база делает без LLM.

12. mkalimulin 1555 04.04.25 16:39 Сейчас в теме

(11) Ну, да. А раз уж все равно обращаешься к нейросети не локально, то зачем тебе своя векторная база?

13. mikukrnet 182 23.07.25 12:12 Сейчас в теме

Подкинул обработке список сотрудников с подразделениям, поспрашивал - отвечает норм, но каждый раз весь текст списывает за счет токенов. На каких объемах уже включится RAG и начнет давать свою экономию?

14. mkalimulin 1555 23.07.25 14:50 Сейчас в теме

(13) Каждый случай индивидуален, но обычно считается, что до 50 страниц текста RAG избыточен.

Оставьте свое сообщение

E-mail:

Автор:

Михаил Калимулин (mkalimulin)

Рейтинг: 1555

Для получения уведомлений о новых публикациях автора подключите телеграм бот: Инфостарт бот

Публикация:

№ 2348224

Создание 01.04.25 10:30

Обновление 01.04.25 10:30

Статистика:

Просмотры 3316

Загрузки 57

Рейтинг 36

Комментарии 14

Характеристики:

Код открыт Да

Рубрики Нейросети

Кому Программист

Тип файла Документация (pdf, docx, ...)

Платформа 1С v8.3

Конфигурация Универсальные

Операционная система Не имеет значения

Страна Не имеет значения

Отрасль Не имеет значения

Налоги Не имеет значения

Вид учета Не имеет значения

Доступ к файлу Бесплатно (free)