RAG, два, три

28.08.25

Интеграция - Нейросети

В библиотеке искусственного интеллекта для 1С появилась поддержка RAG (Retrieval Augmented Generation). Что это такое и как с этим работать, рассказываю в этой статье.

Бесплатные

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Узнавайте о новых бесплатных решениях в нашей телеграм-группе Инфостарт БЕСПЛАТНО

Наименование Скачано Бесплатно
kolobok.txt
.txt 4,18Kb
86 Скачать бесплатно

Вы можете заказать платную доработку или адаптацию этой разработки под вашу конфигурацию на «Бирже заказов».

  • 0% комиссии — оплата напрямую исполнителю;
  • Исполнители любого масштаба — от отдельных специалистов до команд под проект;
  • Прямой обмен контактами между заказчиком и исполнителем;
  • Безопасная сделка — при необходимости;
  • Рейтинги, кейсы и прозрачная система откликов.

Для работы вам понадобится Библиотека искусственного интеллекта для 1С.  Она распространяется бесплатно и вы можете использовать ее для создания своих коммерческих продуктов.

Когда клиенты заводят разговор о RAG, довольно часто приходится слышать об "обучении нейросетей". Дескать, давайте обучим нейросеть нашими данными с помощью RAG. Строго говоря, это неправильно. Обучение нейросетей, это отдельная сложная тема, а с RAG все несколько проще.

Представим, что мы хотим давать ответы на вопросы клиентов, задействовав для этого искусственный интеллект. Мы берем большую и умную нейросеть. Ее уже обучили всему, чему надо и она может поддерживать непринужденный разговор. Но вот конкретно про нас она не знает ничего, или почти ничего. Клиент приходит с простым вопросом: какой у вас график работы? Нам нужно сделать что-то, чтобы нейросеть смогла ответить на него. Для этого ее не надо обучать. Можно поступить проще. Добавить ответ в вопрос. Это и будет тем самым augment, т.е. расширением.

Вопрос клиента:

Какой у вас график работы?

Наше расширение:

Мы работаем по будням, с 9:00 до 18:00 

Что получает на вход нейросеть:

Мы работаем по будням, с 9:00 до 18:00 Какой у вас график работы? 

Понятно, что получив такой вопрос, нейросеть даст на него верный ответ. Разумеется, мы не станем ограничивать себя ответом на один-единственный вопрос. В наше расширение мы загрузим вообще все, что посчитаем нужным так или иначе сообщать клиенту: перечень товаров и услуг, порядок работы, инструкции и т.д.

Здесь и проявляется сила нейросети. Она без проблем найдет в этой массе информации именно то, что нужно для ответа на конкретный вопрос. Но есть одна техническая сложность. Размер этой самой "массы" сильно ограничен. 

Во-первых, есть размер контекста. У разных моделей он разный. У gpt-4o от OpenAI это 128К токенов. У Claude Sonnet 3.7 от Anthropic 200K. У Gemini 2.5 pro от Google 1 миллион токенов и обещают 2 вскорости. Миллион токенов, это достаточно много. Практически "Война и мир" (на английском языке около 700К токенов). Но существует мнение, что с увеличением контекста качество ответов падает. Так что, миллион токенов, это только в теории. На практике и 32К уже многовато. Потому еще, что во-вторых, есть плата за входящие токены. У gpt-4o сейчас 2.5$ за миллион токенов, у Sonnet 3.7 это 3$. Платить по 10 рублей за каждую реплику в диалоге с клиентом может оказаться накладным.

И вот тут возникает идея подмешивать в запрос пользователя не все-все-все, а только то, что имеет отношение к этому запросу. Как определить, что имеет отношение к запросу пользователя? И тут на помощь приходит нейросеть. Она умеет превращать текст в вектор (embedding). Вектор, это много чисел, например 512. А по сути, точка в 512-мерном пространстве. Теперь мы можем разделить наш большой текст, в котором все-все-все, на маленькие части. Для каждой части получим вектор или точку в 512-мерном пространстве. Далее, получив от пользователя запрос, мы и для него рассчитаем точку и определим к какой из ранее рассчитанных точек она ближе всего. Так мы получим ту самую часть большого текста, которую надо добавить в запрос.

Конечно, трудно себе представить 512-мерное пространство, но работает это прекрасно. А еще более прекрасно то, что в Response API от OpenAI (как и в скоропостижно устаревшем Assistant API) вся эта сложная работа с векторной базой скрыта "под капотом". Вы создаете векторную базу одной простой командой, загружаете туда файл или файлы (это не важно, все равно все будет порезано на кусочки неким оптимальным способом). И все готово к работе. Все что нам нужно для того, чтобы заработало "подмешивание", это указать id векторной базы в специально выделенной для этого опции.

 

В библиотеке искусственного интеллекта для 1С, начиная с версии 19, появились функции: СоздатьВекторнуюБазу(), ЗагрузитьФайл(), РазместитьФайл()

 

   

  

В результате мы получаем подготовленную векторную базу с неким id. Этот id мы передаем в опции "vector_store_id" и получаем RAG.

Вы можете самостоятельно поэкспериментировать с этим, пользуясь обработкой БИИ_Пример, которая входит в состав библиотеки.

 

 

 

Файл kolobok.txt, на котором  экспериментировал я, прилагаю.

Как видите, RAG относительно простая вещь. А с библиотекой искусственного интеллекта для 1С это становится просто, как раз-два-три.

Вступайте в нашу телеграмм-группу Инфостарт

См. также

Инструментарий разработчика Нейросети Платные (руб)

Первые попытки разработки на 1С с использованием больших языковых моделей (LLM) могут разочаровать. LLMки сильно галлюцинируют, потому что не знают устройства конфигураций 1С, не знают нюансов синтаксиса. Но если дать им подсказки с помощью MCP, то результат получается кардинально лучше. Далее в публикации: MCP для поиска по метаданным 1С, справке синтакс-помощника и проверки синтаксиса.

15250 руб.

25.08.2025    57713    116    32    

128

Нейросети Пользователь 1С:Предприятие 8 1С:Управление нашей фирмой 1.6 1С:Управление торговлей 11 1С:Управление нашей фирмой 3.0 Оптовая торговля, дистрибуция, логистика Россия Управленческий учет Платные (руб)

Расширение "Искусственный интеллект и нейросети в 1С: Работа с отзывами маркетплейсов" предназначено для применения искусственного интеллекта в повседневной деятельности селлеров на маркетплейсах. Среди функций - работа с отзывами, вопросами и чатами покупателей, диалог с нейросетями, генерация картинок, заполнение описаний номенклатуры и другое.

6100 руб.

03.04.2024    15748    8    0    

12

Нейросети Программист Бесплатно (free)

За десять дней после релиза OneBase получила полноценные управляемые формы, локализацию интерфейса на 14 языков, точную денежную арифметику на decimal, систему ролей и прав, новый REST API и набор CLI-инструментов для разработки совместно с ИИ. Разбираю ключевые изменения платформы, показываю новые возможности и делюсь результатами одной из самых насыщенных недель развития проекта.

05.06.2026    1078    Ibrogim    47    

18

Нейросети Обновление 1С Бесплатно (free)

Когда доработанную 1С не обновляли годами, начинать приходится не с переноса кода, а с разбора того, что вообще накопилось в базе. Там могут быть десятки обработок, расширения, правки типовых объектов, а документации либо нет, либо она давно не актуальна. На примере реального обновления разбираем, как кодовые агенты, MCP-серверы и языковые модели помогают навести порядок в доработках, собрать план миграции, понять, где при переносе будут проблемы, и автоматизировать часть исправлений.

05.06.2026    2567    wonderboy    3    

17

Нейросети Программист Бесплатно (free)

ИИ сделал внешнюю обработку за 19 минут, собрал EPF без входа в Конфигуратор, и она заработала с первого раза! Да, звучит как кликбейт, но это был живой стрим, а не вылизанное демо. В статье показываю стенды, замеры, скиллы, MCP и честные ограничения — чтобы скептики спорили не лозунгами, а своими примерами.

04.06.2026    3412    top_1c    164    

50

Нейросети Программист Бесплатно (free)

Расскажем, как создать ИИ-помощника внутри 1С без Python и другого внешнего кода – только на базе 1С, HTTP-запросов и необходимой инфраструктуры. Разберем универсальный шаблон RAG-системы, который можно адаптировать под разные задачи: от поддержки пользователей и поиска по базе знаний до работы с регламентами и инструкциями. На живом примере соберем минимальный рабочий прототип помощника, который умеет работать с данными, искать релевантный контекст и формировать ответы. Отдельно объясним, почему самым сложным этапом оказывается не архитектура, а качество подготовки данных и чанкинг.

04.06.2026    833    Palk    4    

6

Нейросети Программист Бесплатно (free)

Набор локальных skills для ИИ-агентов под 1С: XML-исходники, EPF/ERF, формы, роли, веб-публикация и test bridge — HTTP-расширение для проверки тестовых баз без COM и UI.

02.06.2026    4019    Aleksandr    63    

30
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. JohnyDeath 302 01.04.25 14:31 Сейчас в теме
Сколько в итоге токенов будет уходить на RAG? Понятно, что обращение к модели будет дешевле, но непонятно на сколько. Что будет-таки уходить в облако и какими порциями? От чего зависит размер этих порций?

Спасибо за библиотеку. Периодически подсматриваю там кусочки и что-то тестирую
cleaner_it; +1 Ответить
2. mkalimulin 1629 01.04.25 15:10 Сейчас в теме
(1) В моем примере получилось около 3000 токенов. Но я ставлю параметры auto при создании векторной базы. В принципе, можно играться размерами чанка (кусочка, chunk) и размерами перекрытия. Response API такое предусматривает. Меньше размеры, меньше токенов, но и качество ответов при этом может снижаться, поэтому оставил auto
cleaner_it; JohnyDeath; fatman78; +3 Ответить
3. vlad1976 01.04.25 18:33 Сейчас в теме
душу только травите. мне база досталась в режиме совместимости 8.3.12. и уже ваше расширение не поставить.
4. mkalimulin 1629 01.04.25 18:36 Сейчас в теме
(3) Так. А в чем загвоздка? JSON, насколько помню с 8.3.6, HTTP еще раньше. Что не дает поставить?
5. vlad1976 01.04.25 19:11 Сейчас в теме
Конфигурация.БиблиотекаИскусственногоИнтеллекта: Переопределение свойств заимствованных объектов в расширениях недопустимо в режиме совместимости 8.3.13 и ниже
6. mkalimulin 1629 01.04.25 19:35 Сейчас в теме
(5) Думаю, это можно будет убрать. Попробую в следующей версии
cleaner_it; +1 Ответить
7. timeforlive 17 02.04.25 10:28 Сейчас в теме
Думал 1 апрельская шутка этот пост. Спасибо, что осветили такой инструмент, буду пробовать.
8. mkalimulin 1629 02.04.25 11:00 Сейчас в теме
(7) Да, я что-то поздно спохватился. Совсем забыл, что 1 апреля надо публиковать либо ничего, либо веселое
9. Ndochp 104 04.04.25 12:56 Сейчас в теме
А векторная база на чем делается?
Вообще кажется что с использованием RAG мы начинаем очень слабо зависеть от ЛЛМ. Кажется токенами платим за "перескажи вывод поиска". А я точно дешевле лично не справлюсь с чтением ответа векторной базы?
10. mkalimulin 1629 04.04.25 13:12 Сейчас в теме
(9) Чтобы превратить текст в вектор нужна нейросеть. Это основной момент. А собственно векторная база играет вспомогательную роль. Просто очень быстро считает расстояния между векторами
11. Ndochp 104 04.04.25 16:35 Сейчас в теме
(10) Наш АИотдел говорит, что в вектор надо класть куски размером 1500 символов с 50% перекрытием и будет счастье. А нейросетка значит нужна чтобы этим кускам сопоставить вектора? Вот этот момент я походу и пропускал. Думал что операцию "докинь еще вот этот кусок" векторная база делает без LLM.
12. mkalimulin 1629 04.04.25 16:39 Сейчас в теме
(11) Ну, да. А раз уж все равно обращаешься к нейросети не локально, то зачем тебе своя векторная база?
13. mikukrnet 182 23.07.25 12:12 Сейчас в теме
Подкинул обработке список сотрудников с подразделениям, поспрашивал - отвечает норм, но каждый раз весь текст списывает за счет токенов. На каких объемах уже включится RAG и начнет давать свою экономию?
14. mkalimulin 1629 23.07.25 14:50 Сейчас в теме
(13) Каждый случай индивидуален, но обычно считается, что до 50 страниц текста RAG избыточен.
Для отправки сообщения требуется регистрация/авторизация