Превентивная аналитика в 1С: прогнозирование падения производительности и сбоев до их возникновения

02.07.26

Чтобы перейти от тушения инцидентов в 1С к превентивному подходу, нужно заранее видеть рост данных, блокировок, времени выполнения операций и другие признаки будущих проблем. Разбираем, какие метрики технологического журнала 1С и СУБД стоит мониторить в реальном времени и как использовать простые ML-модели – регрессию и классификацию – для прогноза падения производительности. Объясняем, как автоматически выявлять аномалии в поведении пользователей и фоновых заданий, настраивать proactive-алерты за часы или дни до инцидента и создавать тикеты в ITSM-системах на превентивные действия.

1С умеет предсказывать будущее

Всем привет! Меня зовут Айдар Сафин. Я главный разработчик 1С в MAGNIT TECH.

Я открою вам страшную тайну: 1С умеет предсказывать будущее. И для этого не надо ехать в Тибет и учиться у монахов, достаточно установить пару программ и настроить мозги.

Эта статья о том, как перестать тушить пожары и начать их предсказывать. Сначала будет теория, чтобы передать основную идею, то есть теоретический блок. Далее я дам практический стек. Я создал новый публичный репозиторий в GitHub, и все, о чем я рассказываю, подкреплено скриптами.

Это пока концепт, эксперимент, первые шаги.

Но там уже есть полезные и рабочие мысли, которыми я хочу поделиться.

Я подробно покажу и объясню, что и где смотреть.

Лучше быть капитаном, видящим риск на горизонте, чем юнгой, затыкающим пробоины.

Часть 1: Классическая картина vs Новая реальность

Picture background

Давайте обозначим проблему. Как у нас обычно происходит в классическом, или реактивном, сценарии?

Например, 9:00. Вася с бухгалтерией начинает возмущаться: «Все виснет, деньги не платят, вы что там сломали?»

Через полчаса ругани и ковыряния админ говорит: «Спокойно, мы все нашли. Это дедлок в регистре сведений или накопления. Сейчас все перезагрузим».

Еще проходит 15 минут, все начинает работать, но от бизнеса мы получаем потерянные деньги, нервы и минус 1005000 к карме IT отдела. Такой подход – это потеря денег.

Узнаете? Мы привыкли работать в режиме пожарных. Прилетело – потушили.

Но цена такого подхода – это не только нервы, это прямые потери бизнеса.

Чем быстрее мы реагируем, тем мы круче? Или все-таки есть другой путь?

Реактивный подход это потеря денег. Главная проблема: мы всегда реагируем постфактум.

Какое решение? Решение – превентивный подход. Это новая парадигма, когда мы предсказываем проблемы и работаем превентивно.

Например, сценарий новой реальности. За три дня до инцидента робот HAL9000 говорит: «Айдар, рост блокировок регистра взаиморасчетов прогнозируется на 200%. Прогнозируется коллапс через 72 часа. Предлагаю оптимизировать индекс».

Понятно, это шутка. На самом деле у нас выполняется скрипт на Python, срабатывает алерт, и мы получаем такое сообщение.

Далее, за два дня до инцидента админ, попивая кофе, в плановом порядке спокойно говорит: «Окей, давайте перестроим индекс».

А в день инцидента, который теперь не происходит, тот же пользователь Вася говорит: «Айдар, слушай, а что у нас так все шустро работает? Ты что улучшил?»

От бизнеса мы получаем спокойствие, доверие, любовь к IT. Хотите жить так же? Я дам вам рецепт, как можно к этому прийти.

Часть 2: Что мы мониторим? От симптомов к причинам

Где искать следы? Два источника истины. Технологический журнал 1С: Ключевые метрики

У нас есть два глаза. Первый глаз – технологический журнал 1С. Второй – метрики СУБД. ТЖ показывает, что конкретно в 1С тормозит и чего оно ждет: может быть, оно ждет, пока база данных читает с диска.

Метрик на самом деле много, но это основные, которые дают 80% результата, – это Duration, длительность операций; WaitTime, время ожиданий; LockTime, время блокировок; и Контекст, пользователи и сеансы.

Где искать следы? Два источника истины. Ключевые метрики СУБД

В СУБД мы смотрим в первую очередь рост размера таблиц и индексов, эффективность кэша, или Cache Hit Ratio, статистику ожиданий БД и количество активных сессий.

Они объясняют почему базе данных так плохо. Только соединив эти два взгляда, мы получаем 4D-очки, в которых видно будущее.

Что ищем? Аномальные всплески, тренды, тех, кто стал тормозом.

Практика: Какие тренды убивают систему первыми

Есть три тренда, которые гарантированно уничтожат производительность, если их игнорировать. Посмотрите на них. Если вы увидели такое у себя – проблема приближается. Но главное – знать, что делать.

Первый тренд – заполнение диска. Мы замеряем размер каждый день и говорим: «Диск закончится через N дней». Что делать? Заказать новый диск, расширить том или почистить архив. У вас есть N дней на спокойное планирование.

Второй тренд – рост блокировок. Если время ожидания растет быстрее числа пользователей – это верный признак приближающегося дедлока. Что делать? Искать проблемные запросы, перестраивать индексы, разбирать длинные транзакции. У вас есть M дней до коллапса.

Третий тренд – деградация индексов. Когда база данных вместо быстрого Index Scan начинает читать всю таблицу целиком – производительность тяжелых отчетов неумолимо падает. Что делать? Перестроить индексы, обновить статистику, оптимизировать структуру таблиц.

Наша задача – не ждать, когда красная линия пересечет критический порог, а вмешаться заранее. И знать, какой инструмент взять в руки.

Часть 3: Применяем ML без data science-отдела

Picture background

Некоторых слово ML пугает. Кажется, что нам нужны бородатые профессора и тонны золота. Нет, нам нужна простая школьная математика и библиотеки, которые уже все умеют.

Не бойтесь аббревиатуры ML. Это не искусственный интеллект, который хочет вас убить, это просто алгоритм, просто инструмент.

Для начала я взял два простых инструмента. Далее еще поясню, какие бывают алгоритмы.

Самый простой – регрессия. У вас есть точки на графике, история роста. Вы проводите через них линию и смотрите, когда она упрется в потолок.

Если объяснять по-простому: представьте, что вы кидаете камень. Зная его скорость и направление, вы можете сказать, куда он упадет. Здесь то же самое.

Второй инструмент – классификация. Это уже интереснее. Это как игра из детства «Найди десять отличий». Мы берем алгоритм, скармливаем ему много ситуаций, когда у нас была проблема.

Это как учить ребенка отличать котиков от собачек. Мы показываем ему много фотографий котиков и собачек, потом ребенок берет картинку и говорит: «Это 85% котик». То же самое, когда мы скармливаем данные алгоритму: он говорит, например, «это 85% дедлок».

Не нужен сложный ИИ. Достаточно классики, которая есть в любой BI-системе (Power BI, Grafana ML) или библиотеке (Python scikit-learn).

Выявление аномалий: когда тишина не норма

Мир 1С цикличен. Утром все приходят, в обед обедают, вечером закрывают день. Если ритм сбился – это аномалия.

Очень важный момент – аномалии бывают не только когда все плохо, но и когда «слишком хорошо».

В этой статье и в репозитории аномалии мы смотрим на сессиях 1С.

Например, если у нас в 11:00 обычно 500 сессий, плюс-минус 20, а в какой-то момент вместо 500 стало 200 сессий, это аномалия. Это не повод для радости. Это не значит, что база стала меньше потреблять или меньше нагружаться. Это значит, что что-то отвалилось. Например, планировщик фоновых заданий. Через какое-то время пойдет лавина или шквал звонков, или еще какие-то вещи. Поэтому на это тоже нужно реагировать. И это тоже можно предсказывать с помощью Python.

Если график активных пользователей резко упал, это не значит, что все ушли в отпуск.

Это значит, что, скорее всего, отвалился вход в систему. И через час раздастся шквал звонков. Мы должны предупредить это.

По-простому: представьте, что у вас есть сосед, который каждый день в 22:00 начинает сверлить. И в какой-то момент у вас тишина. Вы не радуетесь, вы в панике. Наверное, он или сильно заболел, или, наоборот, задумал что-то глобальное.

Типы машинного обучения: краткий обзор с примерами

Часть 4: Встраиваем прогнозы в процесс: от алерта до тикета

Просто сделать прогноз – это половина дела. Нам нужно, чтобы при этом что-то происходило. В этом примере я покажу практическую часть: когда у нас сработает алерт, должно что-то происходить – например, возникать тикет.

Обычный алерт приходит, когда диск уже заполнен на 95% – в 3 часа ночи, срочно вставай и чисти.

Превентивный алерт приходит за неделю: «Диск заполнится через 7 дней, скорость роста 5 ГБ/день, запланируй расширение».

Разница между паникой и плановой работой.

Proactive-алерты: как не будить админа ночью

Picture background

Посмотрите на разницу в формулировках. Старый реактивный алерт приходит в 3 часа ночи и требует немедленных действий. Новый превентивный алерт приходит в рабочее время, дает неделю на спокойное планирование и не требует вставать с кровати. Все дело в том, что мы мониторим не текущее состояние, а скорость приближения к катастрофе.

Прогнозировать можно с помощью Prometheus и Grafana. В Grafana есть встроенный Grafana ML. Либо можно использовать Python-скрипты. Такой пример я тоже дам.

Прогноз – это половина дела. Вторая половина – сделать так, чтобы он не потерялся.

У нас это работает как часы: модель видит угрозу, дергает за ниточку, и в Jira появляется задача.

Разработчик не гадает, что бы такого сделать, он уже знает, что через 5 дней будет проблема.

Это не магия, это API и немного скриптов.

Чтобы прогноз не оставался просто прогнозом или гаданием на кофейной гуще, нам нужно, чтобы при срабатывании автоматически создавался тикет в одной из ваших систем. Классическая ITSM-система – Jira.

Например, модель, то есть скрипт, обрабатывает данные и видит проблему с отчетом. Уверенность – 92%. Дальше скрипт стучится в Telegram, отправляет уведомление и при этом создает тикет в Jira.

Текст может быть таким: «Отчет «Оборотка» перестанет работать через 5 дней». Описание говорит, что сейчас отчет формируется 45 секунд, но я прогнозирую, что через три дня он начнет формироваться 180 секунд. Кому назначаем? Группе 1С-разработки. Приоритет высокий.

Разработчик приходит на следующий день, берет задачу из бэклога и спокойно ее делает без аврала. Это все реально сделать.

Часть 5: Практический стек

Это была теория, переходим к практике.

Я выложил в GitHub https://github.com/magnit-tech/1CML новый публичный репозиторий, который называется 1CML.

Этот репозиторий пока концепт, эксперимент, первые шаги. Можно сказать, что это мой pet-проект. Но на тестовом контуре, на своих рабочих тестовых машинах, я это все обкатывал. Это еще пока не продуктив, но здесь уже есть много рабочих скриптов, готовые конфиги, дашборды, подробная документация. Вы можете этим спокойно пользоваться.

Я выложил все в открытый доступ, чтобы вы могли покрутить, потестировать и забрать себе полезные куски.

Что внутри репозитория?

magnit-tech/1CML

Давайте быстро пройдем по структуре репозитория. В папке prometheus лежат готовые конфиги для сбора метрик с Windows и PostgreSQL, а также правила алертов. В grafana – три дашборда в формате JSON: прогноз диска, тренды блокировок и контрольные карты аномалий. Импортируются в два клика.

В репозитории четыре основные папки.

рrometheus – готовые конфиги для сбора метрик.

grafana – три дашборда, которые импортируются за минуту.

scripts – все Python-скрипты: прогноз диска, парсер техжурнала, детектор аномалий.

И отдельная папка itsm с интеграциями под Jira, YouTrack, ServiceNow, Redmine и GitLab.

Все остальное – схемы для ClickHouse и PostgreSQL, документация и пример .env файла. Клонируйте и пользуйтесь.

Самое интересное в папке scripts. Здесь у нас отдельные модули: disk для прогноза диска, locks для анализа дедлоков, anomalies для детектора аномалий. В папке ideas – заготовки на будущее: прогноз длительности закрытия месяца, анализ медленных запросов, прогноз пиковых нагрузок и еще 7 идей. И отдельная папка itsm с интеграциями под Jira, YouTrack, ServiceNow, Redmine и GitLab.

В clickhouse и postgresql – SQL-скрипты для создания таблиц. В docs – подробная документация по каждому модулю, включая future_1C_ML.md с планами развития. Есть тесты в папке tests, а models и logs создаются автоматически при работе – они в .gitignore.

И, конечно, .env.example – шаблон для настройки, requirements.txt со всеми зависимостями и главный README.md. Все структурировано, все готово к использованию.

Но повторюсь – это пока пилот, в проде мы это еще не используем. Но потенциал, надеюсь, очевиден.

Архитектура решения

Архитектура строится вокруг четырех компонентов. ClickHouse хранит техжурнал 1С.

Prometheus собирает метрики с Windows и СУБД. Python-скрипты обучают модели, делают прогнозы и сохраняют результаты в PostgreSQL.

И все это визуализируется в Grafana – здесь мы смотрим графики, тренды и прогнозы.

При срабатывании алертов уходят уведомления в Telegram и автоматически создаются задачи в Jira или других ITSM-системах.

Все компоненты open source, все уже лежит в репозитории готовое.

Источники данных

Технологический журнал 1С	Метрики СУБД
Длительность операций	Размер таблиц
Время ожиданий (WaitTime)	Cache Hit Ratio
Время блокировок (LockTime)	Статистика ожиданий
Контекст (пользователи)	Активные сессии

Схема в ClickHouse: clickhouse /schema.sql

Еще раз напомню про источники данных. С ТЖ мы собираем и смотрим длительность операций, WaitTime, LockTime, контекст. С СУБД мы смотрим размер таблиц, Cache Hit Ratio, статистику ожиданий, активные сессии.

У нас два источника данных. Технологический журнал 1С показывает, что происходит внутри платформы: длительность операций, блокировки, ожидания.

А метрики СУБД и Windows рассказывают, почему базе данных плохо: заполнен ли диск, хватает ли памяти, кто создает нагрузку.

Критические тренды

Тренд	Что измеряем	Прогноз
Заполнение диска	Размер таблиц	"Диск кончится через N дней"
Рост блокировок	LockTime в техжурнале	"Риск дедлока через M дней"
Деградация индексов	Рост Seq Scan	"Отчет упадет ниже SLA через K дней"

Критические тренды, которые реализованы и вокруг которых построены скрипты, дашборды и прочее, такие.

Мы отслеживаем три главных тренда. Заполнение диска – считаем скорость роста и прогнозируем дату, когда место кончится.

Рост блокировок – если время ожидания увеличивается быстрее числа пользователей, скоро будет дедлок.

И деградация индексов – когда база начинает читать таблицы целиком вместо быстрого поиска по индексу.

ML-модели в проекте

Модель	Файл	Назначение
Linear Regression	predict_disk.py	Прогноз заполнения диска
Isolation Forest	train_anomaly_detector.py	Поиск аномалий
Prophet	Grafana plugin	Прогноз с сезонностью

ML для чайников: docs/ml_for_dummies.md

В проекте пока реализованы три типа моделей.

Первая – линейная регрессия (Linear Regression). Например, predict_disk.py – это прогноз диска.

Вторая – train_anomaly_detector.py, поиск аномалий. Это пример, когда мы анализируем сессии и падение количества сессий.

Третья – Prophet-модель. Она может учитывать сезонность, например то, что в понедельник нагрузка всегда выше, чем в пятницу.

PostgreSQL: хранение результатов

postgresql/create_tables.sql

PostgreSQL отвечает за сохранение результатов и прогнозов. Когда Python-скрипт отработал и сделал прогноз, он сохраняет результат в таблицу, например disk_forecast в PostgreSQL. Здесь как раз пример того, какие таблицы создаются. SQL-файл тоже можно посмотреть.

ClickHouse: хранение техжурнала

Полезные запросы: clickhouse /queries.sql

ClickHouse, как я уже сказал, используется для хранения ТЖ. Здесь мы выполняем и парсинг, и хранение. Здесь есть запрос: какая таблица создается, какой вид. Используется techlog_parser.py для парсинга технологического журнала регулярками и сохранения его в эту таблицу.

Технологический журнал 1С – это десятки, сотни гигабайт текста в день.

ClickHouse создан для таких объемов: он сжимает данные в 5-10 раз и отвечает на запросы за секунды.

В репозитории лежит готовая схема таблиц и полезные запросы для анализа блокировок.

Prometheus: сбор метрик

prometheus/prometheus.yml

Prometheus использует pull-модель, то есть сам забирает метрики с эндпоинтов.

Для Windows используется windows_exporter на порту 9182.

Для PostgreSQL используется postgres_exporter на порту 9187.

Все метрики хранятся с временными метками и доступны через PromQL.

В репозитории уже готовый prometheus.yml со всеми нужными job'ами – просто укажите свои таргеты

Скрипт прогноза заполнения диска

Перейдем непосредственно к скриптам, о которых я говорил. Сначала дам сам скрипт, а потом подробное пояснение.

scripts/predict_disk.py

Скрипт predict_disk.py запускается раз в день, берет историю заполнения диска за 60 дней, обучает линейную регрессию и считает прогноз на 7, 14 и 30 дней вперед.

Если прогноз пересекает критический порог – создает задачу в Jira и отправляет алерт в Telegram.

Код открыт, можете посмотреть – там всего 5 строчек с моделью.

Как это физически работает? Прогноз диска

Давайте посмотрим, как это работает физически.

Каждое утро в 8 часов планировщик Windows запускает скрипт.

Он за 30 секунд делает все: читает историю, обучает модель, считает прогноз, проверяет пороги.

Если диск грозит заполниться – создает задачу в Jira и отправляет уведомление в Telegram.

Все автоматически, вы только смотрите дашборды и выполняете задачи из Jira.

Чтобы это было наглядно, я в docs создал MD-файлы с полным описанием того, как это работает: начиная от забора метрик, сохранения в таблицу, запуска скриптов и так далее. Например, disk_forecast_physical.md в docs – это сквозной пример.

Подробное описание, как физически работает прогноз диска:

disk-forecast-physical-workflow.md

Для прогноза диска у нас постоянно крутятся Prometheus, Grafana, ClickHouse, PostgreSQL. По расписанию для прогноза диска раз в день в 8:00 запускается планировщик.

Что он делает? Считает историю диска из PostgreSQL, обучает модель линейной регрессии с помощью Python на 60 днях, делает прогноз. Например, говорит, что через 14 дней будет 195 ГБ.

Если диск 200 ГБ, а у нас 195 ГБ, это выше 95% лимита. Значит, срабатывает алерт. В группу админов отправляется Telegram-уведомление и создается задача в Jira. В логе записывается, что задача такая-то создана.

Детектор аномалий

scripts/train_anomaly_detector.py

Детектор аномалий ищет необычное поведение системы.

Раз в неделю train_anomaly_detector.py обучает модель Isolation Forest на истории сессий и блокировок, а каждый час detect_anomalies.py проверяет текущие метрики.

Если сегодня в 10 утра сессий на 70% меньше обычного – система бьет тревогу.

Например, на 10:00 утра он смотрит: если обычно у нас 200 сессий, а сейчас на 70% меньше, будет алерт. Схема та же: уведомление в Telegram и задача в Jira.

Как это физически работает? Детектор аномалий

Как это физически работает? В 3:00, допустим, раз в неделю скрипт загружает 30 дней, обучает модель и сохраняет ее в anomaly_model.pkl. Каждый час detect_anomaly.py загружает свежие данные за последний час и сравнивает с обычной моделью. Если отклонение больше трех сигм, отправляется Telegram.

Пример срабатывания. Обычно у нас, к примеру, 150 сессий. Сегодня 40 сессий. Скрипт смотрит: 40 минус 150, стандартное отклонение равно 5,5 – это больше трех. Срабатывает условие, что нужно выполнить. Это реальные процедуры на Python: send_telegram и create_jira_ticket.

Система сразу бьет тревогу: возможно, упал планировщик или проблемы с доступом.

Мы узнаем об этом за часы до того, как пользователи начнут жаловаться.

В docs есть 1c-anomaly-detector.md. Это тоже сквозной пример от начала до конца, как все работает.

Подробное описание, как физически работает детектор аномалий сессий 1С:

1c-session-anomaly-detector.md

Прогноз дедлоков

Последнее – как физически работает прогноз дедлоков.

Каждые пять минут запрашиваются данные из технологического журнала в ClickHouse, где он у нас хранится. Далее скрипт анализирует тренды блокировок. Если рост больше 50%, можно смотреть, к примеру, время выполнения: среднее выполнение было одно, стало больше на 50% или больше на 100%. Если больше 100%, мы считаем, что сработал алерт.

Есть специальный скрипт. Данные по дедлокам сохраняются в ClickHouse, выполняется SQL-скрипт, который решает, сработал алерт или нет.

Пример срабатывания справа: в понедельник среднее время блокировки было 50 мс, во вторник стало 75 мс, в среду – 120 мс. Это плюс 140% от понедельника. Мы считаем тренд, и если тренд больше 100%, отправляем алерт в Telegram и создаем задачу в Jira.

По ходу определяется топ таблиц. В сообщении, которое будет создано в Jira, будет записано, какие именно таблицы нужно посмотреть.

Подробнее весь цикл от начала до конца можно посмотреть в docs, в 1c-deadlock-prediction.md. По запросу коллег я сделал дополнительный MD по расходованию ресурсов этими скриптами: ml_scripts_resource_usage.md.

Подробное описание:

1c-deadlock-prediction.md

Расход ресурсов ML-скриптами:

ml_scripts_resource_usage.md

Сколько ресурсов потребляют скрипты

Самый тяжелый скрипт – techlog_parser.py. Ему нужны SSD и 2-4 ядра CPU с частотой от 2.5 ГГц

Пиковая нагрузка раз в неделю – train_anomaly_detector.py. Потребляет много CPU и RAM на 5-30 минут

Ежечасные скрипты – легкие, не создают заметной нагрузки, работают на 2.0+ ГГц

Частота CPU важна – разница между 2.0 ГГц и 3.0 ГГц дает ускорение в 1.5 раза для парсинга

Для старта достаточно 4 ядер CPU 2.5 ГГц и 2 ГБ RAM под ML-скрипты (плюс отдельно под БД)

Золотое правило: планируйте пиковые нагрузки (обучение моделей) на ночное время, когда мало пользователей.

Отдельно я не считаю базу данных. Я хочу сказать, что сами ML-скрипты потребляют относительно мало ресурсов.

Дашборды Grafana

Я уже упомянул, что в Grafana есть встроенный Grafana ML. Для Grafana я добавил три дашборда.

Дашборд	Файл	Назначение
Прогноз диска	disk_forecast.json	Факт + прогноз + пороги
Тренды блокировок	locks_trend.json	Анализ LockTime
Контрольные карты	anomalies.json	Выявление аномалий

grafana/dashboards

Первый – disk_forecast.json. Это прогноз заполнения диска с доверительным интервалом.

Второй – locks_trend.json. Это график блокировок и топ таблиц.

Третий – anomalies.json. Это контрольные карты, где видно отклонение от нормы.

Пример дашборда: прогноз диска

Файл: grafana/dashboards/disk_forecast.json

Для примера: прогноз диска именно в Grafana. Мы смотрим, что текущий объем, например, 156,3 ГБ, всего диск – 200 ГБ. Grafana тоже может предсказывать линейную регрессию.

Смотрим: через семь дней у нас 175 ГБ, через 14 дней – 195 ГБ, через 30 дней – 240 ГБ. Через 14 дней уже 97,5%, это плохо. Это больше 95%, уже warning. А через 30 дней прогноз вообще 240 ГБ. Понятно, что это никак не влезет в диск, который сам 200 ГБ.

Вот так это настраивается в Grafana.

Алерты в Telegram и ITSM-интеграция

Отдельно есть репозиторий scripts/alert_telegram.py, где с отзывами, заголовками, деталями можно отправлять сообщения. Это кусочек кода.

Алерты в Telegram

scripts/alert_telegram.py

Как это настраивается? В общем файле можно настроить токен Telegram и chat ID, куда вы хотите отправлять эти уведомления. Таким образом можно связать Telegram со всей этой историей.

ITSM-интеграция: файлы репозитория

Система	Версия API	Файл
Jira Cloud	REST v3	jira_integration.py
Jira Server	REST v2	jira_integration.py
YouTrack	Hub REST	youtrack_integration.py
ServiceNow	Table API	servicenow_integration.py
Redmine	REST	redmine_integration.py
GitLab Issues	REST v4	gitlab_integration.py

scripts/itsm

Есть также блок ITSM. Это то, что я говорил про ITSM-системы: например, Jira, YouTrack, GitLab Issues и прочее.

В репозитории есть отдельный модуль, папка scripts/itsm. Там они перечислены. В .env-файле можно указать тип вашей ITSM-системы и настроить ваши данные. Тогда уведомления будут отправляться туда, куда вам нужно.

Быстрый старт за 15 минут

Полная инструкция: docs/install_windows.md

Если вы хотите в таком же виде развернуть это на своей тестовой машине, можно использовать быстрый старт: клонировать репозиторий, запустить ClickHouse в Docker, восстановить зависимости и запустить тестовый прогноз, если у вас уже начнут загружаться данные в ClickHouse.

Вам не обязательно делать именно так. Вы можете подстроить это под свой процесс. Здесь имеется в виду вариант, если вы хотите поднять полностью тестовый контур с такими же параметрами, как в репозитории.

Ожидаемые результаты внедрения

Какие бизнесовые ожидания? Что мы получим от внедрения всего этого?

Ноль незапланированных простоев вместо 2-4 часов в месяц. Прогноз проблем за 14 дней вместо реагирования постфактум.

Экономию времени администраторов – 40 часов в месяц. В деньгах для компании с 500 пользователями это около 4.5 миллионов рублей в год.

IT перестает быть статьей расходов и становится стратегическим активом, который приносит бизнесу стабильность и экономию. Окупаемость – с первого же предотвращенного сбоя.

Планы развития 1CML

Что дальше? Можно добавить интеграцию с 1С через HTTP-сервисы, улучшить модель для прогноза дедлоков на Random Forest и сделать веб-интерфейс.

В среднесрочной перспективе – три новые ML-модели: прогноз длительности закрытия месяца, анализ медленных запросов с рекомендациями по индексам и прогноз пиковых нагрузок.

Есть и идеи для исследования – анализ эффективности сотрудников, прогноз лицензий, оптимизация настроек кластера. Все это открыто, код на GitHub, Pull Requests приветствуются.

Если интересно, присоединяйтесь!

И помните: это пока концепт, эксперимент, первые шаги. Но вы уже можете забрать себе полезные куски и доработать под свои задачи.

future_1C_ML.md

Итог

Итог – это ключевой сдвиг парадигмы.

Picture background

Если вы раньше работали как пожарный, то теперь вы капитан дальнего плавания. Вы приходите к бизнесу и показываете отчет не о существующих катастрофах, а о предотвращенных катастрофах на текущий квартал и даже на следующий квартал.

Вы становитесь стратегическим активом, который экономит деньги, а не тратит их.

Коллеги, давайте запомним главное. Пока мы бегаем с ведром и тушим пожар, мы просто обслуживающий персонал. Но когда вы приходите к руководству или коллегам и говорите: «Я тут посчитал: если мы сейчас сделаем A, то через месяц случится Б», тогда мы становимся стратегами.

И тогда мы идем к руководству не с жалобой «упал сервер», а с отчетом: «Я предотвратил столько-то проблем на следующий месяц». Тогда можно просить больше денег. Обычно работает безотказно.

*************

Статья написана по итогам доклада (видео), прочитанного на конференции INFOSTART TEAM EVENT.

Вступайте в нашу телеграмм-группу Инфостарт

+31 –

Вы можете заказать платную адаптацию этой статьи под ваши задачи на «Бирже заказов».

0% комиссии — оплата напрямую исполнителю;
Исполнители любого масштаба — от отдельных специалистов до команд под проект;
Прямой обмен контактами между заказчиком и исполнителем;
Безопасная сделка — при необходимости;
Рейтинги, кейсы и прозрачная система откликов.

См. также

Если вы всё ещё парсите технологический журнал 1С gawk-скриптами - вот как я решил эту задачу иначе

Технологический журнал Программист 1С 8.3 Россия Бесплатно (free)

Устал парсить ТЖ 1С gawk-скриптами каждый раз заново - собрал нормальный инструмент. DuckDB под капотом, разбор ТЖ, планов под MS SQL и PostgreSQL, AI-объяснения опционально.

08.07.2026 2572 nazarovss 27

Темная сторона технологического журнала – что может пойти не так при парсинге?

Технологический журнал Программист Бесплатно (free)

Парсинг техжурнала 1С – это не просто «распарсить JSON» или CSV, а работа с множеством неочевидных особенностей формата. Показываем, какие проблемы могут возникнуть из-за дублей свойств и событий, «полей-призраков», нестандартных имен свойств, разрозненного контекста, кавычек, апострофов и других нюансов, которые легко ломают парсеры и искажают результаты анализа. Объясняем, чем может помочь ИИ при работе с техжурналом и почему даже при использовании современных инструментов важно понимать внутреннюю логику логов. В статье собраны главные правила надежного парсинга и примеры ситуаций, где техжурнал может неожиданно показать свою «темную сторону».

17.06.2026 2892 Andreynikus 9

"Легкий" аналог ЦУП

Технологический журнал Мониторинг Программист 1С 8.3 Абонемент ($m)

Решение-заготовка для автоматического мониторинга и расследования технологических инцидентов в случаях невозможности использования решений КИП.

1 стартмани

29.05.2026 1911 8 tori131313 3

Графическая утилита PostgreSQL mini Profiler (в помощь экспертам по технологическим вопросам 1С и не только им)

Linux Технологический журнал 1С:Предприятие 8 Бесплатно (free)

Графическая утилита, сделанная по принципу Microsoft SQL Server Profiler, но для СУБД PostgreSQL Позволяет легко настраивать сбор планов запросов как средствами PostgreSQL, так и технологическим журналом 1С Предприятие с их последующей визуализацией. Простая, понятная для пользователей утилита, не требующая прав администратора для визуализации, и требующая их для настройки. Скомпилированная в исполняемый файл.

20.05.2026 2480 capitan 4

Поиск утечек памяти в 1С: пошаговая методика анализа CALL+LEAKS в технологическом журнале

HighLoad оптимизация Технологический журнал Системный администратор Программист 1С 8.3 Бесплатно (free)

Пошаговая методика поиска утечек памяти в 1С через технологический журнал: как связать события CALL и LEAKS по clientID, агрегировать тысячи строк стеков вызовов в компактное дерево сценариев, классифицировать проблему без открытия конфигуратора и упаковать результат в готовую задачу разработчику — с bash-скриптами для каждого шага и разбором на реальном примере

17.04.2026 3906 maraty 9

Аудит, оптимизация, контроль: рецепт повышения быстродействия 1С

HighLoad оптимизация Технологический журнал Программист Бесплатно (free)

Пользователи жалуются на медленную работу 1С, система нестабильна под нагрузкой, а попытки «починить» не дают результата? В статье разбираем, как подойти к оптимизации производительности комплексно: от анализа инфраструктуры и базы данных до уровня кода и пользовательских операций. Показываем пошаговый подход «аудит – оптимизация – контроль» и объясняем, какие инструменты помогают быстро выявить и устранить узкие места. На реальном примере проходим путь от первичного мониторинга до внедрения оптимизаций и стабилизации системы.

06.04.2026 2344 kulmaksim 0

Перенос логов технологического журнала в ClickHouse

HighLoad оптимизация Технологический журнал Программист 1С 8.3 1С 8.5 Абонемент ($m)

tjclick - кроссплатформенная утилита для копирования логов технологического журнала платформы 1С в КликХаус

10 стартмани

02.04.2026 1169 1 SerVer1C 0

Логирование и анализ API, сбор логов на работающей конфигурации 1С

Инструментарий разработчика Мобильная разработка Технологический журнал Системный администратор Программист 1С:Предприятие 8 1С:Бухгалтерия 3.0 Россия Платные (руб)

Расширение для сбора логов на работающей конфигурации 1С, отчёт с оценкой APDEX. Оптимизация и оценка запросов API с базой.

18300 руб.

01.04.2026 885 0 0

Комментарии

Подписаться на ответы Инфостарт бот

Свернуть все

1. starik-2005 3294 02.07.26 19:14 Сейчас в теме

В общем-то правильно, но называть "а скорость приближения к катастрофе" ML, а не простой интерполяцией - это такое...

Формула Свободный объем / Скорость изменения — это чистая школьная математика (задача на движение, где Расстояние / Скорость = Время). В IT-мониторинге такой подход называется линейной экстраполяцией или детерминированным алгоритмом.

Почему это НЕ машинное обучение (ML):

Нет обучения на данных:
* Формула жестко задана человеком (T = V / v). Система не ищет скрытые закономерности, а просто делит одно число на другое.
* Нет адаптивности: Формула не учитывает контекст (например, что по выходным данные не пишутся, а в полночь запускается бэкап). Она берет сухую скорость «здесь и сейчас».

Как выглядел бы этот же алерт с настоящим ML:

Если бы за прогнозированием стояли алгоритмы машинного обучения (например, библиотека Prophet от Meta, сети LSTM или алгоритмы Anomalydetector), система бы:
* Изучила историю за несколько месяцев.
* Поняла сезонность (в пятницу вечером нагрузка падает, в понедельник утром растет).
* Отсекла аномалии (случайный разовый скачок веса файла не ломал бы прогноз на неделю вперед).
* Выдала гибкий нелинейный график прогноза.

Показать

Но и это очень относительно можно назвать ML - пушкой по воробьям.

Конечно, обучать нейросеть ради обычного диска — это абсолютный оверкилл (избыточность) и пустая трата ресурсов. Ни один инженер в здравом уме так делать не станет.

Вы абсолютно правы: школьной формулы Расстояние / Скорость для этой задачи более чем достаточно. Она работает мгновенно, не требует видеокарт и решает проблему в 99% случаев.

Мой пример с ML был нужен только для того, чтобы показать разницу в терминах, так как в IT-индустрии сейчас модно называть «нейросетями» и «искусственным интеллектом» любую банальную формулу с делением.

2. aidar_safin 147 02.07.26 19:24 Сейчас в теме

(1) Спасибо за такое развёрнутое дополнение - в точку.

Вы правы, по сути это чистая интерполяция, и в статье она завернута в ML-обёртку скорее для наглядности идеи, чем ради строгости. Пример с Prophet и сезонностью отличный, наглядно показывает разницу. И да, тянуть нейросеть ради прогноза диска - это реально оверкилл, тут без вариантов.

Про моду на «ИИ» везде, где можно, — тоже полностью поддерживаю. Надо называть вещи своими именами. Принял 👍

3. aidar_safin 147 02.07.26 19:34 Сейчас в теме

И ещё момент: мне важно было начать с теории и с простого, чтобы не отпугнуть тех, кто с ML пока на «вы». Линейная регрессия - это такой входной билет. Разберётся человек с ней, увидит пользу - дальше сам захочет копнуть глубже. А вывалить сразу всё - значит потерять читателя. Так что упрощения были осознанными.

4. starik-2005 3294 02.07.26 21:45 Сейчас в теме

(3)

Линейная регрессия - это такой входной билет.

Да, штука отличная. Вам там ML/AI-спецы не нужны часом? )))

6. aidar_safin 147 03.07.26 09:20 Сейчас в теме

(4) У нас есть отдельный отдел) Но если будут вакансии сообщу.

5. SweetSweetLoot 03.07.26 09:17 Сейчас в теме

Статья крутая, но надо было, в тегах статьи, в операционной системе: postgres поставить.
А то потом может не найти, или хотя бы в названии статьи postgres упомянуть.

Прикрепленные файлы:

7. aidar_safin 147 03.07.26 09:20 Сейчас в теме

(5) Спасибо! Напишу модераторам.

8. aidar_safin 147 03.07.26 09:30 Сейчас в теме

(5) Добавили. Операционная система: PostgreSQL.

9. andrew.ab 244 03.07.26 14:20 Сейчас в теме

Отличная статья и репо огонь - все по полочкам!

10. aidar_safin 147 03.07.26 14:49 Сейчас в теме

(9) Спасибо!

11. пользователь 03.07.26 15:11

Сообщение было скрыто модератором.

...

12. пользователь 03.07.26 15:28

Сообщение было скрыто модератором.

...

13. RocKeR_13 1480 03.07.26 16:09 Сейчас в теме

Если немного понудеть...

мы получаем 3D-очки, в которых видно будущее.

Время обычно считают четвертым измерением, поэтому очки будут 4D)

14. aidar_safin 147 03.07.26 17:06 Сейчас в теме

(13)
Спасибо, поправил!)

15. nazarovss 25 06.07.26 03:47 Сейчас в теме

Мне кажется, можно как-то более оптимально - анализ ТЖ, анализ сложных запросов - все это с удобным UI, и вообще для не-Экспертов:
https://github.com/anymasoft/1c-optimyzer.git

16. aidar_safin 147 06.07.26 09:45 Сейчас в теме

(15)

15. nazarovss 06.07.26 03:47
Мне кажется, можно как-то более оптимально - анализ ТЖ, анализ сложных запросов - все это с удобным UI, и вообще для не-Экспертов:
https://github.com/anymasoft/1c-optimyzer.git

Сергей, привет! Спасибо за наводку - проект мощный, реально впечатляет. Видно, что проделана огромная работа.

Согласен, для анализа ТЖ и копания в запросах специализированный тул вроде Optimyzer'а даст сто очков вперёд любому самописному стеку. У него и UI заточен под расследование, и DuckDB под капотом, и планы запросов смотреть можно - красота.

У нас же немного другой фокус: мы не столько расследуем уже случившееся, сколько пытаемся предсказать, что случится. То есть не «почему вчера упало», а «когда упадёт завтра и что именно». Поэтому и стек другой - Prometheus, Grafana, ML-модели на тренды. Optimyzer'у такая задача и не ставилась, это просто другой класс инструментов.

Но в целом да - для эксперта, который хочет быстро и удобно разобрать ТЖ, ваш проект, пожалуй, лучший опенсорс из того, что я видел. Буду следить за развитием!

17. nazarovss 25 07.07.26 19:34 Сейчас в теме

(16)
Спасибо за оценку. Было бы интересно с вами вместе поработать - мне кажется, в вопросах производительности 1С еще целый пласт вещей, которые можно автоматизировать и которые вот прям недоавтоматизированы

18. SweetSweetLoot 08.07.26 08:20 Сейчас в теме

Я тут подумал, но если у вас просто линеиная аппроксимация для предикции и просмотр текущих параметров, то можно было просто zabix натравить, там и из коробки система оповещений.

А так я у них видел и для postgres и систему предикции состояния системы:
https://www.zabbix.com/integrations/postgresql
https://www.zabbix.com/documentation/5.2/ru/manual/config/triggers/prediction (предикция проблем у забикса)

А вот 1с:
https://github.com/slothfk/1c_zabbix_template_ce

19. aidar_safin 147 08.07.26 14:09 Сейчас в теме

(18)

SweetSweetLoot, всё верно, для линейной аппроксимации и обычных алертов Zabbix - тема проверенная, сам его уважаю. Там реально всё из коробки: и сбор метрик, и триггеры, и прогнозирование через встроенную predictive triggering.

Разница в замахе. Zabbix отлично скажет «диск кончится через 5 дней», и этого часто достаточно. А мы замахнулись на чуть более хитрые штуки: Isolation Forest для аномалий в сессиях, прогноз дедлоков с анализом трендов по конкретным таблицам, автосоздание тикетов в нескольких ITSM. Плюс хотелось показать коллегам, как ту же Prophet прикрутить, если захочется сезонность учесть - в Zabbix такое уже не сделаешь без костылей.

Но по-хорошему да, для 80% задач Zabbix'а хватит за глаза, и шаблон для 1С у ребят добротный. Спасибо за линки, полезно!

Для отправки сообщения требуется регистрация/авторизация

Автор:

Айдар Сафин (aidar_safin)

Рейтинг: 147

Вы можете заказать платную консультацию или разработку у автора. Будет создан приватный заказ на «Бирже заказов» для автора.

Публикация:

№ 2729161

Создание 02.07.26 10:11

Обновление 02.07.26 10:11

Статистика:

Просмотры 2336

Загрузки 0

Рейтинг 31

Комментарии 17

Характеристики:

Код открыт Да

Рубрики Технологический журнал

Кому Системный администратор ,
Программист

Тип файла Нет файла

Платформа Не имеет значения

Конфигурация Универсальные

Операционная система PostgreSQL

Страна Не имеет значения

Отрасль Не имеет значения

Налоги Не имеет значения

Вид учета Не имеет значения

Доступ к файлу Бесплатно (free)

Превентивная аналитика в 1С: прогнозирование падения производительности и сбоев до их возникновения

1С умеет предсказывать будущее

Часть 1: Классическая картина vs Новая реальность

Часть 2: Что мы мониторим? От симптомов к причинам

Часть 3: Применяем ML без data science-отдела

Часть 4: Встраиваем прогнозы в процесс: от алерта до тикета

Часть 5: Практический стек

Скрипт прогноза заполнения диска

Прогноз дедлоков

Сколько ресурсов потребляют скрипты

Дашборды Grafana

Алерты в Telegram и ITSM-интеграция

Быстрый старт за 15 минут

Ожидаемые результаты внедрения

Итог

См. также

Журнал

База знаний

Лаборатория

Анализ & Управление

Сопровождение 1С

Корпоративные решения

Обучение

Маркетплейс

Проектный офис

Мероприятия

Видеозаписи

Биржа заказов

Форум

Мерч

О компании