RAG, два, три

28.08.25

В библиотеке искусственного интеллекта для 1С появилась поддержка RAG (Retrieval Augmented Generation). Что это такое и как с этим работать, рассказываю в этой статье.

Бесплатные

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Узнавайте о новых бесплатных решениях в нашей телеграм-группе Инфостарт БЕСПЛАТНО

Наименование	Скачано	Бесплатно
kolobok.txt .txt 4,18Kb 88	88	Скачать бесплатно

Вы можете заказать платную доработку или адаптацию этой разработки под вашу конфигурацию на «Бирже заказов».

0% комиссии — оплата напрямую исполнителю;
Исполнители любого масштаба — от отдельных специалистов до команд под проект;
Прямой обмен контактами между заказчиком и исполнителем;
Безопасная сделка — при необходимости;
Рейтинги, кейсы и прозрачная система откликов.

Для работы вам понадобится Библиотека искусственного интеллекта для 1С. Она распространяется бесплатно и вы можете использовать ее для создания своих коммерческих продуктов.

Когда клиенты заводят разговор о RAG, довольно часто приходится слышать об "обучении нейросетей". Дескать, давайте обучим нейросеть нашими данными с помощью RAG. Строго говоря, это неправильно. Обучение нейросетей, это отдельная сложная тема, а с RAG все несколько проще.

Представим, что мы хотим давать ответы на вопросы клиентов, задействовав для этого искусственный интеллект. Мы берем большую и умную нейросеть. Ее уже обучили всему, чему надо и она может поддерживать непринужденный разговор. Но вот конкретно про нас она не знает ничего, или почти ничего. Клиент приходит с простым вопросом: какой у вас график работы? Нам нужно сделать что-то, чтобы нейросеть смогла ответить на него. Для этого ее не надо обучать. Можно поступить проще. Добавить ответ в вопрос. Это и будет тем самым augment, т.е. расширением.

Вопрос клиента:

Какой у вас график работы?

Наше расширение:

Мы работаем по будням, с 9:00 до 18:00

Что получает на вход нейросеть:

Мы работаем по будням, с 9:00 до 18:00 Какой у вас график работы?

Понятно, что получив такой вопрос, нейросеть даст на него верный ответ. Разумеется, мы не станем ограничивать себя ответом на один-единственный вопрос. В наше расширение мы загрузим вообще все, что посчитаем нужным так или иначе сообщать клиенту: перечень товаров и услуг, порядок работы, инструкции и т.д.

Здесь и проявляется сила нейросети. Она без проблем найдет в этой массе информации именно то, что нужно для ответа на конкретный вопрос. Но есть одна техническая сложность. Размер этой самой "массы" сильно ограничен.

Во-первых, есть размер контекста. У разных моделей он разный. У gpt-4o от OpenAI это 128К токенов. У Claude Sonnet 3.7 от Anthropic 200K. У Gemini 2.5 pro от Google 1 миллион токенов и обещают 2 вскорости. Миллион токенов, это достаточно много. Практически "Война и мир" (на английском языке около 700К токенов). Но существует мнение, что с увеличением контекста качество ответов падает. Так что, миллион токенов, это только в теории. На практике и 32К уже многовато. Потому еще, что во-вторых, есть плата за входящие токены. У gpt-4o сейчас 2.5$ за миллион токенов, у Sonnet 3.7 это 3$. Платить по 10 рублей за каждую реплику в диалоге с клиентом может оказаться накладным.

И вот тут возникает идея подмешивать в запрос пользователя не все-все-все, а только то, что имеет отношение к этому запросу. Как определить, что имеет отношение к запросу пользователя? И тут на помощь приходит нейросеть. Она умеет превращать текст в вектор (embedding). Вектор, это много чисел, например 512. А по сути, точка в 512-мерном пространстве. Теперь мы можем разделить наш большой текст, в котором все-все-все, на маленькие части. Для каждой части получим вектор или точку в 512-мерном пространстве. Далее, получив от пользователя запрос, мы и для него рассчитаем точку и определим к какой из ранее рассчитанных точек она ближе всего. Так мы получим ту самую часть большого текста, которую надо добавить в запрос.

Конечно, трудно себе представить 512-мерное пространство, но работает это прекрасно. А еще более прекрасно то, что в Response API от OpenAI (как и в скоропостижно устаревшем Assistant API) вся эта сложная работа с векторной базой скрыта "под капотом". Вы создаете векторную базу одной простой командой, загружаете туда файл или файлы (это не важно, все равно все будет порезано на кусочки неким оптимальным способом). И все готово к работе. Все что нам нужно для того, чтобы заработало "подмешивание", это указать id векторной базы в специально выделенной для этого опции.

В библиотеке искусственного интеллекта для 1С, начиная с версии 19, появились функции: СоздатьВекторнуюБазу(), ЗагрузитьФайл(), РазместитьФайл()

В результате мы получаем подготовленную векторную базу с неким id. Этот id мы передаем в опции "vector_store_id" и получаем RAG.

Вы можете самостоятельно поэкспериментировать с этим, пользуясь обработкой БИИ_Пример, которая входит в состав библиотеки.

Файл kolobok.txt, на котором экспериментировал я, прилагаю.

Как видите, RAG относительно простая вещь. А с библиотекой искусственного интеллекта для 1С это становится просто, как раз-два-три.

Вступайте в нашу телеграмм-группу Инфостарт

+38 –

См. также

Infostart MCP: готовые MCP серверы для вайбкодинга в 1С

Инструментарий разработчика Нейросети Платные (руб)

Первые попытки разработки на 1С с использованием больших языковых моделей (LLM) могут разочаровать. LLMки сильно галлюцинируют, потому что не знают устройства конфигураций 1С, не знают нюансов синтаксиса. Но если дать им подсказки с помощью MCP, то результат получается кардинально лучше. Далее в публикации: MCP для поиска по метаданным 1С, справке синтакс-помощника и проверки синтаксиса.

15250 руб.

25.08.2025 62495 129 36

136

Нейросеть для 1С: обновления бесплатного MCP-сервера mcp-1c

Нейросети Программист Бесплатно (free)

Нейросеть для 1С, которая пишет рабочий код на BSL по вашей конфигурации: четыре месяца и больше сорока релизов после первой статьи про бесплатный MCP-сервер mcp-1c. Разберём, что изменилось: память на больших базах упала в разы, поиск по коду ускорился, добавилась параллельная работа и совместимость с Claude, Cursor и другими ИИ-клиентами. И что осталось прежним.

08.07.2026 6215 VyachGo 3

MCP-сервер внутри 1C:EDT: даём AI-агентам «руки», не открывая ни одного порта наружу

Нейросети EDT Программист 1С:Предприятие 8 Россия Абонемент ($m)

LLM-агенты уже неплохо рассуждают о коде 1С — но рассуждают вслепую. Модель не видит вашу конфигурацию: ей либо копируют модули в чат руками, либо выгружают конфигурацию в файлы и индексируют — и индекс устаревает в момент первой правки. А главное — агент не может ничего сделать: прочитал, посоветовал, а вносить правку снова человеку. Мы решали эту задачу для своей линейки 1C Intelligence Suite — это её вторая часть, о которой мы рассказываем публично.

1 стартмани

08.07.2026 2338 galich 13

Как убедить скептиков начать работать с ИИ, на опыте обучения разработчиков

Нейросети Бесплатно (free)

Почему разработчики не всегда начинают пользоваться ИИ-инструментами, даже если у них уже есть доступ к GPT-чату, Copilot, OpenCode и 1С:Напарнику. Показываем, как через личные разговоры, короткие воркшопы и понятные аналогии – калькулятор, поисковик, автодополнение и Dota 2 – можно снизить страхи, скепсис и недоверие к генеративным нейросетям. Разбираем, почему одних рассылок и лозунгов про «будущее» недостаточно, и как маленькие быстрые победы помогают людям попробовать ИИ в рабочих и бытовых задачах. Статья будет полезна руководителям и тимлидам, которые сталкиваются с сопротивлением сотрудников и хотят привести команду к спокойному, практичному отношению к современным ИИ-инструментам.

06.07.2026 1441 leemuar 16

Самое важное в жизни - красиво умереть! Вкатываемся в ML/AI!

Нейросети Программист Бесплатно (free)

Реальный ML там, где вы зачем-то используете AI. Вкатываемся под катом!

01.07.2026 2532 starik-2005 58

История одного твитта или побазарим за вайб-кодинг. Часть 1 (Анатомия агента)

Нейросети Бесплатно (free)

Простым языком про ИИ-агентов: чем агент отличается от LLM, как работает function calling и зачем нужен MCP. Разбираем структуру JSON, цикл работы агента и показываем "амнезию" модели на эксперименте с Ollama. Для тех, кто хочет понять "базу" без занудства. Часть 1.

26.06.2026 2158 Junior_1C 33

Бесплатный MCP-сервер для 1С: ИИ читает данные базы и структуру метаданных (MCP:RSV Data)

Нейросети Программист 1С:Предприятие 8 Бесплатно (free)

Бесплатный MCP-сервер, который даёт ИИ-ассистенту (Claude, Cursor и др.) читать данные рабочей базы 1С простыми словами — остатки, документы, справочники, регистры. Агенту не нужно знать язык запросов 1С: он описывает, что хочет, а сервер строит запрос сам. Работает на любой конфигурации (УТ, ERP, БП, самописная), только чтение, отдаёт лишь то, что доступно текущему пользователю. Вторая функция — отдаёт актуальную структуру метаданных любой конфигурации (таблицы, поля, типы), что полезно и при разработке как контекст для ИИ-агента. Реализован как расширение конфигурации.

22.06.2026 12206 Prepod2003 15

ИИ в 1С: верхи не рискуют, низы хотят

Нейросети Бесплатно (free)

ИИ-агенты в корпоративной разработке 1С: почему инициатива исходит снизу, а не сверху.

17.06.2026 4694 Junior_1C 42

Комментарии

Подписаться на ответы Инфостарт бот

Свернуть все

1. JohnyDeath 302 01.04.25 14:31 Сейчас в теме

Сколько в итоге токенов будет уходить на RAG? Понятно, что обращение к модели будет дешевле, но непонятно на сколько. Что будет-таки уходить в облако и какими порциями? От чего зависит размер этих порций?

Спасибо за библиотеку. Периодически подсматриваю там кусочки и что-то тестирую

2. mkalimulin 1628 01.04.25 15:10 Сейчас в теме

(1) В моем примере получилось около 3000 токенов. Но я ставлю параметры auto при создании векторной базы. В принципе, можно играться размерами чанка (кусочка, chunk) и размерами перекрытия. Response API такое предусматривает. Меньше размеры, меньше токенов, но и качество ответов при этом может снижаться, поэтому оставил auto

3. vlad1976 01.04.25 18:33 Сейчас в теме

душу только травите. мне база досталась в режиме совместимости 8.3.12. и уже ваше расширение не поставить.

4. mkalimulin 1628 01.04.25 18:36 Сейчас в теме

(3) Так. А в чем загвоздка? JSON, насколько помню с 8.3.6, HTTP еще раньше. Что не дает поставить?

5. vlad1976 01.04.25 19:11 Сейчас в теме

Конфигурация.БиблиотекаИскусственногоИнтеллекта: Переопределение свойств заимствованных объектов в расширениях недопустимо в режиме совместимости 8.3.13 и ниже

6. mkalimulin 1628 01.04.25 19:35 Сейчас в теме

(5) Думаю, это можно будет убрать. Попробую в следующей версии

7. timeforlive 17 02.04.25 10:28 Сейчас в теме

Думал 1 апрельская шутка этот пост. Спасибо, что осветили такой инструмент, буду пробовать.

8. mkalimulin 1628 02.04.25 11:00 Сейчас в теме

(7) Да, я что-то поздно спохватился. Совсем забыл, что 1 апреля надо публиковать либо ничего, либо веселое

9. Ndochp 104 04.04.25 12:56 Сейчас в теме

А векторная база на чем делается?
Вообще кажется что с использованием RAG мы начинаем очень слабо зависеть от ЛЛМ. Кажется токенами платим за "перескажи вывод поиска". А я точно дешевле лично не справлюсь с чтением ответа векторной базы?

10. mkalimulin 1628 04.04.25 13:12 Сейчас в теме

(9) Чтобы превратить текст в вектор нужна нейросеть. Это основной момент. А собственно векторная база играет вспомогательную роль. Просто очень быстро считает расстояния между векторами

11. Ndochp 104 04.04.25 16:35 Сейчас в теме

(10) Наш АИотдел говорит, что в вектор надо класть куски размером 1500 символов с 50% перекрытием и будет счастье. А нейросетка значит нужна чтобы этим кускам сопоставить вектора? Вот этот момент я походу и пропускал. Думал что операцию "докинь еще вот этот кусок" векторная база делает без LLM.

12. mkalimulin 1628 04.04.25 16:39 Сейчас в теме

(11) Ну, да. А раз уж все равно обращаешься к нейросети не локально, то зачем тебе своя векторная база?

13. mikukrnet 182 23.07.25 12:12 Сейчас в теме

Подкинул обработке список сотрудников с подразделениям, поспрашивал - отвечает норм, но каждый раз весь текст списывает за счет токенов. На каких объемах уже включится RAG и начнет давать свою экономию?

14. mkalimulin 1628 23.07.25 14:50 Сейчас в теме

(13) Каждый случай индивидуален, но обычно считается, что до 50 страниц текста RAG избыточен.

Для отправки сообщения требуется регистрация/авторизация

Автор:

Михаил Калимулин (mkalimulin)

Рейтинг: 1628

Вы можете заказать платную консультацию или разработку у автора. Будет создан приватный заказ на «Бирже заказов» для автора.

Публикация:

№ 2348224

Создание 01.04.25 10:30

Обновление 28.08.25 23:34

Статистика:

Просмотры 6789

Загрузки 88

Рейтинг 38

Комментарии 14

Характеристики:

Код открыт Да

Рубрики Нейросети

Кому Программист

Тип файла Документация (pdf, docx, ...)

Платформа 1С:Предприятие 8

Конфигурация Универсальные

Операционная система Не имеет значения

Страна Не имеет значения

Отрасль Не имеет значения

Налоги Не имеет значения

Вид учета Не имеет значения

Доступ к файлу Бесплатно (free)

RAG, два, три

Бесплатные

См. также

Журнал

База знаний

Лаборатория

Анализ & Управление

Сопровождение 1С

Корпоративные решения

Обучение

Маркетплейс

Проектный офис

Мероприятия

Видеозаписи

Биржа заказов

Форум

Мерч

О компании