Свой MCP-сервер для метаданных 1С

25.06.25

Разработка - Инструментарий разработчика

Для эффективного использования современных LLM им не хватает контекста об 1С, как минимум, знания структуры метаданных 1С, а еще лучше знаний БСП и синтакс-помощника :) Технология MCP помогает решать эту проблему. Под катом описание MVP-решения, которое можно далее дорабатывать под себя. Мне сильно не хватало подобной статьи, чтобы сэкономить бессонные ночи.

Файлы

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование Скачано Купить файл
(только для физ. лиц)
Обработка выгрузки описания метаданных любой конфигурации 1С для использования в MCP c RAG
.epf 9,50Kb
23 1 850 руб. Купить

Подписка PRO — скачивайте любые файлы со скидкой до 85% из Базы знаний

Оформите подписку на компанию для решения рабочих задач

Оформить подписку и скачать решение со скидкой

Как и многие из вас, я пробую использовать LLM'ки для программирования на 1С. Для задач, связанных с интеграциями или чисто алгоритмических вопросов - это уже классно помогает. Но большая часть нашей работы все же предполагает знание структуры метаданных 1С (а еще лучше с БСП и синтакс-помощника).

Встроенную в 1С выгрузку в xml-файлы я даже не рассматривал, очевидно, что объемы будут несовместимыми с контекстами LLM, даже с 1 млн токенов у Gemini. Описание структуры среднего документа/справочника само по себе не маленькое, а с избыточностью xml-разметки - это вообще жесть.

Первое время, пока не было популярности MCP, я использовал простой ручной подход:

  1. Внешней обработкой выгружал описание метаданных в markdown разметке (маркдаун хорошо понимают LLM'ки, а объемом сильно компактнее xml).
  2. Выгружал конкретный объект и, опционально, связанные с ним объекты.

Подставляя такой файлик в контекст запроса к LLM, получается сильно качественнее результат.

В последние месяцы только и разговоров что об MCP. Это классное решение, которое позволяет LLM'ке самой дозапрашивать данные. Нужно было только мою ручную маркдаун-выгрузку обернуть в MCP-сервер с RAG'ом на векторной БД.

Ниже описание MVP-решения, которое можно далее дорабатывать под себя. Мне сильно не хватало подобной статьи, чтобы сэкономить бессонные ночи.

 

Демо

Топовые LLM'ки неплохо знают некоторый собирательный образ типовых конфигураций 1С, поэтому и без MCP/RAG могут написать валидный код. Более наглядно будет на отраслевых конфигурациях, чей исходный код они либо не видели, либо видели крайне мало. На видео пример с Рарус Аптекой (УНФ):

 

Как это работает

Подготовка

Нужна машинка с установленным Docker и Docker Compose. Я делал все на linux, но подозреваю, что и на современных Windows c WSL может сработать. Я сразу не рассматривал локальные MCP через STDIO, мне кажется, это не удобно, не универсально. И хотелось в дальнейшем начать наконец использовать старую nvidia 1070 на домашнем сервере. Поэтому сразу делал remote MCP, хотя с ними свои нюансы. В общем, запускать можно хоть на удаленной, хоть на локальной машине, просто протоклол у MCP будет streamable HTTP (или SSE для Copilot)

Клонируете репозиторий, переходите в папку проект и запускаете скрипт, который запустит сборку докер-образов и затем сами контейнеры:

git clone https://github.com/FSerg/mcp-1c-v1.git
cd mcp-1c-v1
./start.sh

В зависимости от скорости машинки и интернета это может быть от нескольких минут, до десятков минут. В основном из-за того что библиотека SentenceTransformers, которая используется для генерации эмбеддингов, будет скачивать torch, cuda (итоговый image получается 6+ Гб).

В результате запустится несколько докере-контейнеров:

  • Qdrant - векторная база данных Qdrant
  • Embedding Service - сервис генерации эмбеддингов (векторов)
  • Loader - веб-интерфейс для загрузки описания объектов метаданных 1С в Qdrant
  • MCP Server - сам MCP-сервер
  • Inspector - веб-интерфейс для тестов/отладки MCP

После того как image'ы сбилдятся и запустятся контейнеры, нужно в первую очередь проследить за логами контейнера embedding-service:

docker-compose logs -f embedding-service

чтобы убедиться, что он полностью запустился (поднялся http-сервис на 5000-порту). При первом запуске он скачивает модель эмбеддингов с сайта hugginface и были с этим проблемы (боюсь меня просто блочили за активность).

По умолчанию в embeddings/config.json прописана легковесная модель all-MiniLM-L6-v2, которая дает приемлемый результат. После того как с ней все запуститься и будет работать, то можно поменять в конфиг и прописать модельку по-современней и по бенчмаркам более крутую Qwen/Qwen3-Embedding-0.6B, которая дает более качественные эмбеддинги, соответственно более точный поиск на менее четкий запрос (нужно будет перезапустить контейнер embedding-service).

 

 

Теперь выгружаем описание конфигурации с помощью внешней обработки: ПолучитьТекстСтруктурыКонфигурацииФайлами.epf

В обработке два параметра:

  • сколько выгружать объектов каждого типа (делал чисто для тестов, чтобы не выгружать сразу все объекты), поставьте 9999, если выгружаете всё.
  • сколько выгружать описаний составных типов (если у какого-то объекта более 10-20 типов, то лучше выгрузить это как "составной" тип)

 

 

Обработка сформирует zip-архив в котором будет табличка objects.csv c перечнем всех объектов и рядом пачка маркдаун-файлов с описанием каждого объекта.

Открываем веб-интерфейс сервиса загрузки http://youraddress:8501 и загружаем полученный zip-архив.

Загрузчик создаст в векторной БД Qdrant коллекцию 1c_rag. В процессе загрузки векторизуются только внутр.названия объектов и их синоним. А сами подробные описания объектов сохраняются в БД как часть метаданных коллекции.

В моем первом подходе я векторизовывал всё описание объектов большими моделями типа jinaai/jina-embeddings-v3. Это требовало больше ресурсов, но смысла не имело, потому что оказалось, что по запросу "расходная накладная" в пространстве векторов описание (вектор) условного "расходного ордера" будет ближе чем расходной накладной, в силу более сложной структуры первого. Быстро стало понятно, что даже поиск по ключевым словам даст лучше результат, но все равно сделал на векторах, потому что разные LLM'ки по-разному формулируют запросы объектов и векторизация дает некоторую универсальность.

Перед переходом к IDE, осталось убедиться, что MCP-сервер работает:

  • Можно через веб-интерфейс MCP-инспектора http://youraddress:6274
  • Или любым http-клиентом, типа Postman, Insomnia, curl: http://youraddress:6274/search
{
  "query": "Расходная накладная",
  "object_type": "Документ",
  "limit": 3
}

 

 

Использование

Все, можно прописать MCP в настройках проекта вашей IDE. В Cursor'е и в плагинe RooCode для VSCode агенты уже поддерживают streamable http протокол MCP, поэтому там прописываем такой адрес: http://youraddress:8000/mcp

Для Copilot в VSCode нужно прописать вариант адреса с поддержкой более старого протокола SSE: http://youraddress:8000/mcp/sse

Хотя на сайте Microsoft говориться, что поддерживается и streamable http, но на практике не работает. И в последних версиях плагина Cline для VSCode тоже заявлена поддержка streamable http, а по факту оба протокола не заработали с Cline.

Но все это меняется каждый день, и новые модели и MCP развивается (появляется авторизация и прочее). В след за этим и IDE'шки и плагины релизятся буквально каждый день. То что не работает сегодня - заработает завтра и наоборот :)

Для VSCode Copilot .../YourProject/.vscode/mcp.json

{
    "servers": {
        "my-1c-mcp-server": {
            "url": "http://youraddress:8000/mcp/sse"
        }
    }
}

Для Cursor .../YourProject/.cursor/mcp.json

{
    "servers": {
        "my-1c-mcp-server": {
            "url": "http://youraddress:8000/mcp"
        }
    }
}

Для VSCode RooCode .../YourProject/.roo/mcp.json

{
  "mcpServers": {
    "My1C": {
      "type": "streamable-http",
      "url": "http://youraddress:8000/mcp"
    }
  }
}

Топовые LLM'ки, такие как Gemini Pro, Claude Sonnet сами иногда догадываются об использовании MCP-сервера, если в запросе есть упоминание об 1С. Но лучше явно это указать в промпте (или в правилах):

Обязательно используй MCP-сервер для поиска описания структуры данных 1С.

Ломающее мой мозг наблюдение: LLM'кам не всегда достаточно простого упоминания типа "следуй спецификации из файла...". Зачастую нужно усиливать это прилагательными, чтобы получать более качественный результат. Например, "следуй спецификации из файла внимательно" или "следуй спецификации из файла строго". Это может звучать странно, но это действительно помогает.

 

 
 Обновление 25.06.2025 - Добавлена фича нескольких коллекций (таблиц) векторной БД

 

Можно при загрузке описаний метаданных указать имя коллекции векторной БД.
Таким образом в Qdrant можно загрузить описания разных конфигураций, например:

  • - 1c_ut
  • - 1c_unf

...

А когда MCP будете прописывать в настройках конкретного проекта, например Cursor, то можно указать имя коллекции через заголовок:

.../YourProject/.cursor/mcp.json

{
    "servers": {
        "my-1c-mcp-server": {
            "headers": {
                "x-collection-name": "1c_unf"
            },
            "url": "http://youraddress:8000/mcp"
        }
    }
}

Т.е. один инстанс MCP-сервера можно подключать к разным проектам для работы с метаданными разных конфигураций 1С

 

Проверено на следующих конфигурациях и релизах:

  • Управление нашей фирмой, редакция 3.0, релизы 3.0.11.169, 3.0.10.235
  • Управление торговлей, редакция 11, релизы 11.5.22.67, 11.5.17.221
  • Бухгалтерия предприятия, редакция 3.0, релизы 3.0.176.38, 3.0.169.18
  • Розница, редакция 3.0, релизы 3.0.11.169, 3.0.10.235

MCP llm RAG Cursor VS Code RooCode Cline DeepSeek Gemini ChatGPT Copilot Claude OpenAI

См. также

Инструментарий разработчика Роли и права Запросы СКД Программист Руководитель проекта 1С v8.3 Управляемые формы Запросы Система компоновки данных Платные (руб)

Инструменты для разработчиков 1С 8.3: Infostart Toolkit. Автоматизация и ускорение разработки на управляемых формах. Легкость работы с 1С.

15500 руб.

02.09.2020    196849    1085    409    

1006

SALE! 15%

Инструментарий разработчика Чистка данных Свертка базы Инструменты администратора БД Системный администратор Программист Руководитель проекта 1С v8.3 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 Россия Платные (руб)

Инструмент представляет собой обработку для проведения свёртки или обрезки баз данных. Работает на ЛЮБЫХ конфигурациях (УТ, БП, ERP, УНФ, КА и т.д.). Поддерживаются серверные и файловые базы, управляемые и обычные формы. Может выполнять свертку одновременно в несколько потоков. А так же автоматически, без непосредственного участия пользователя. Решение в Реестре отечественного ПО

8400 7140 руб.

20.08.2024    32850    201    104    

188

Пакетная печать Печатные формы Инструментарий разработчика Программист 1С v8.3 Запросы 1С:Зарплата и кадры бюджетного учреждения 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 Платные (руб)

Инструмент, позволяющий абсолютно по-новому взглянуть на процесс разработки печатных форм. Благодаря конструктору можно значительно снизить затраты времени на разработку печатных форм, повысить качество и "прозрачность" разработки, а также навести порядок в многообразии корпоративных печатных форм.

22200 руб.

06.10.2023    22877    62    19    

90

Инструменты администратора БД Инструментарий разработчика Роли и права Программист 1С v8.3 1C:Бухгалтерия Россия Платные (руб)

Расширение позволяет без изменения кода конфигурации выполнять проверки при вводе данных, скрывать от пользователя недоступные ему данные, выполнять код в обработчиках. Не изменяет данные конфигурации, легко устанавливается практически на любую конфигурацию на управляемых формах.

15000 руб.

10.11.2023    15605    66    33    

84

Администрирование веб-серверов Сервера Нейросети Программист Платные (руб)

Сервер поиска по метаданным и поиска по коду, Сервер экспорта и поиска по документации, Сервер синтаксической проверки кода

17.06.2025    3217    40    comol    5    

23

Инструментарий разработчика Программист 1С v8.3 Платные (руб)

Инструмент для написания и отладки кода в режиме «1С:Предприятие». Представляет собой консоль кода с возможностью пошаговой отладки, просмотра значений переменных любых типов, использования процедур и функций, просмотра стека вызовов, вычисления произвольных выражений на встроенном языке в контексте точки останова, синтаксического контроля и остановки по ошибке. В консоли используется удобный редактор кода с подсветкой, контекстной подсказкой, возможностью вызова конструкторов запроса и форматной строки.

9360 руб.

17.05.2024    33068    112    48    

155

Инструментарий разработчика Программист 8.3.14 Россия Платные (руб)

Расширение для конфигурации “Конвертация данных 3”. Добавляет подсветку синтаксиса, детальную контекстную подсказку, глобальный поиск по коду.

20000 руб.

07.10.2021    20193    8    32    

44
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. FSerg 162 16.06.25 11:30 Сейчас в теме
Это решение помогает лишь с небольшой частью задач: типа выгрузок/загрузок, интеграциях с другими системами, когда нужно понимание метаданных.
Бо́льшая же часть задач требует знания стандартных модулей, бизнес-логики и прочее, поэтому - без иллюзий 🤷
NeLenin; sleemp; +2 Ответить
4. shchukin_vv 16.06.25 19:16 Сейчас в теме
(1) вопрос, ещё не до конца в контексте. Как я понял , облачную модель полноценно недоучить контексту 1с( имею ввиду скормить все модули основой базы и расширений), а оффлайн модели в свободном доступе можно обучить, но как я понимаю они будут слабоваты по сравнению с топовыми chatgpt/gemini/grok?
5. FSerg 162 16.06.25 22:06 Сейчас в теме
(4) ChatGPT дает оптимистичный ответ :)
Цель:
Дообучить LLM (например, Qwen или CodeLlama) пониманию и генерации кода на языке 1С:Предприятие 8.

✅ Оптимальный подход:
Использовать QLoRA на базе модели, ориентированной на программирование:
CodeLlama, DeepSeek-Coder, StarCoder2, Phi-3-mini и т.д.

Почему?
- Кодовые LLM уже знают контекст IDE, структуру кода, форматы.
- QLoRA позволяет дообучить модель с минимальными ресурсами.
- Поддержка новых языков требует изменения внутренних представлений модели — это возможно только через fine-tuning или LoRA.

Далее по-шагам...
2. FSerg 162 16.06.25 11:37 Сейчас в теме
Как понять какую лучше использовать модель ембеддингов?
Я смотрел на специализированном лидерборде: MTEB

Среди небольших мультиязычных (с поддержкой русского) моделей до 1B параметров выделяется `Qwen/Qwen3-Embedding-0.6B`
При ее использовании по запросу "Накладная реализации товаров и услуг" ближайший вектор находится "Расходная накладная"! С другими моделями запросы должны быть более точными, чтобы найти нужный объект.
Прикрепленные файлы:
Artem-B; sleemp; +2 Ответить
3. shchukin_vv 16.06.25 19:05 Сейчас в теме
Вот и топовый контент подъехал. Такие вещи , конечно, хотелось бы в более заводской упаковке получать. Типа в напарнике 1с ЕДТ или в турбоконф 1с
rpgshnik; NeLenin; SerVer1C; +3 Ответить
6. SerVer1C 925 17.06.25 08:27 Сейчас в теме
Насколько, вообще, LLM помогает писать запросы. На скрине показан отчет по остаткам - но это примитив, сеть могла взять его из "базы данных". А вот что-нить большое и полезное, состоящее из нескольких пакетов, возможно сгенерить? Может, быстрее будет написать запрос руками или в конструкторе, чем писать длиннющий промпт и потом ещё в несколько попыток подталкивать сеть к около-правильному результату?
7. FSerg 162 17.06.25 09:41 Сейчас в теме
(6) Вполне закономерный комментарий, не хватает более жизненного примера.
Сложно-составные запросы, не напишет, конечно. Claude Sonnet такого накрутить может, куча бесполезных соединений в запросе, а еще и несколько альтернативных вариантов сделает. Прям приходится в промпте добавлять "реализуй только то что требуется и не более".

Интеграции, выгрузки/загрузки, печ.формы, хорошо помогает. Да, их надо подправлять руками, но все равно рутину классно забирает.

Рабочую задачу чтобы на публичное видео записать, надо сначала данные анонимизировать. Кстати, анонимайзер данных в базе - вполне простая задача для llm'ки :)
rpgshnik; NeLenin; sleemp; +3 Ответить
19. wtlz 276 25.06.25 10:43 Сейчас в теме
(7)
Sonnet такого накрутить может, куча бесполезных соединений в запросе, а еще и несколько альтернативных вариантов сделает. Прям приходится в промпте добавлять "реализуй только то что требуется и не более".

Интеграции, выгрузки/загрузки, печ.формы, хорошо пом


вопрос:
1. можно ли к этому прикрутить или намутить отдельный сервер для выгрузки исходного кода (gitsync+gitlab уже существующий, например), чтобы ответы были еще умнее с учетом существующего кода?
2. есть идеи по выгрузке синтаксис-помощника и справки текущей версии 1С?
3. базу знаний (методические материалы) по конфигурации/базе - выгружать в отдельный сервер или сюда же?
20. FSerg 162 25.06.25 11:14 Сейчас в теме
(19)
2. есть идеи по выгрузке синтаксис-помощника и справки текущей версии 1С?

Под это есть классное решение от Корякина Алексея: MCP сервер для API платформы 1С Предприятие
В форке я добавлял возможность запуска его в докере.
21. FSerg 162 25.06.25 11:30 Сейчас в теме
(19)
1. можно ли к этому прикрутить или намутить отдельный сервер для выгрузки исходного кода (gitsync+gitlab уже существующий, например), чтобы ответы были еще умнее с учетом существующего кода?

Это сделано в решении у Олега Филиппова: https://infostart.ru/marketplace/2405549/
Один из его контейнеров векторизует штатную выгрузку 1С в файлы всей конфигурации (и метаданые и код). Я купил, но потестировать пока не смог, не могу сказать насколько это помогает (я про поиск по коду).

Еще в его же решении подсмотрел проверку синтаксиса с помощью https://github.com/1c-syntax/bsl-language-server. Она работает, но пришлось переделать, по двум причинам:
- каждое обращение заново запускает java (это заметно долго)
- результат проверки возвращается в LSP-формате, который для llm неудобен, хотя они и справляются с его интерпретацией
- простым текстом llm'ки понимают лучше, а компактность "человечного" ответа экономит контекстное окно
В общем, проверку синтаксисам переделал, как мне кажется, более инженерно, скоро опубликую.
8. user2148075 18.06.25 10:55 Сейчас в теме
Можно ли на один сервер несколько структур конфигураций отправить? корректно будет работать?
9. FSerg 162 18.06.25 12:06 Сейчас в теме
(8) Нет, под это надо дорабатывать.
Я бы, наверно, добавил возможность создавать несколько коллекций (таблиц) в векторной БД, под каждую конфигурацию - свою.
И доработал бы MCP сервер, чтобы можно было, например, в заголовке запросов, передавать имя коллекции. Благо, что в во всех IDE'шках MCP подключаются на уровне проекта и можно параметры задавать.
17. FSerg 162 25.06.25 00:35 Сейчас в теме
(8) Обновил на гитхабе решение (с поддержкой нескольких векторных коллекций): Релиз 1.1.0
user2148075; +1 Ответить
10. user1209971 77 18.06.25 12:41 Сейчас в теме
Подскажите. правильно ли я понимаю что векторная база и эмбеддинги нужны только ради нечеткого поиска markdown разметки. Если поиск можно было бы чем-то заменить, тогда можно было бы обойтись без векторной базы и всех сложностей. В итоге MCP сервер выдаёт в качестве ответа конкретную markdown разметку?
11. FSerg 162 18.06.25 13:04 Сейчас в теме
(10) Все верно, можно обойтись без векторной базы. Если в промпте указывать какие именно объекты конфигурации за что отвечают, оберунть их в кавычки, усилить прилагательными, то агентские модели будут к MСP отправлять запрос с точными названиями объектов и тогда обычный поиск по названию или по ключевым слова будет работать. А "нечеткость" можно было бы реализовать чем-то типа "расстояние левенштейна". У меня с векторной БД, потому что я изначально шел по пути векторизации всего тела описания объекта. Быстро понял, что для этой задачи - плохой подход, а инфра-то уже вся была настроена :)
14. Artem-B 104 23.06.25 16:55 Сейчас в теме
(11) А лучше наверное использовать гибридный поиск: семантический + полнотекстовый. Qdrant по-моему из коробки так умеет. Или у вас так и реализовано ?
15. FSerg 162 23.06.25 17:47 Сейчас в теме
(14) Это MVP, проверить что это вообще работает.
А дальше по планым, как вы и предлагаете:
- гибридный поиск
- реранкер
12. maxx 999 20.06.25 09:45 Сейчас в теме
Развернули ваш проект, всё работает будем изучать.
Возникли сразу вопросы:

1. Если у меня несколько конфигураций. Какой сценарий тогда работы? грузить ещё в RAG? промты разные для разных конфигураций?

2. Если мне нужно документацию подгрузить таким же образом? например, описание объектов, а может просто описание бизнес-процессов где объекты участвуют.
13. FSerg 162 20.06.25 10:10 Сейчас в теме
(12) Это MVP, т.е. подразумевается, что дальше дорабатывается под свои нужды.
Вопрос про несколько конфигуарций не первый, поэтому думаю я доработаю на след.неделе.
Идея такая:
- в векторной БД создавать для каждой конфигурации свою таблицу/коллекцию
- в параметрах вызова MCP-сервера (например, в заголовках) указывать конфигурацию
18. FSerg 162 25.06.25 00:37 Сейчас в теме
(12) Обновил на гитхабе решение (с поддержкой нескольких векторных коллекций): Релиз 1.1.0
22. maxx 999 26.06.25 11:05 Сейчас в теме
(18) Будем пробовать. Спасибо.
16. wtlz 276 24.06.25 17:22 Сейчас в теме
Спасибо, что делитесь бесплатно :)
kraynev-navi; FSerg; +2 Ответить
23. vlad1976 27.06.25 17:17 Сейчас в теме
к "MCP Server" не могу подключится
Прикрепленные файлы:
24. FSerg 162 27.06.25 17:29 Сейчас в теме
(23) Для контейнеров создается одна общая вирт.сеть
networks:
      - mcp-network


Поэтому через 127.0... может не работать

Скорее всего заработает по имени контейнера
http://mcp-server:8000/mcp

Или эти варианты
http://172.19.0.5:8000/mcp
http://ваш_локальный_айпи:8000/mcp - вот это точно должно сработать
25. vlad1976 27.06.25 18:30 Сейчас в теме
Оставьте свое сообщение