Возможности:
1. Мониторинг сеансов.
В решении предусмотрена возможность описать триггеры на встроенном языке используя в качестве параметров текущие показатели сеанса в кластере 1С.
Решение считывает показатели сеансов баз для подключенных кластеров через RAS 1С и фиксирует их в базе, из-за использования RAS нет проблемы с мониторингом различного парка версий платформ из одного решения, момент подключения внешним соединением к различным платформам так же решается ниже.
После считывания, каждый сеанс проходит проверку на превышение описанных в Справочнике "События" условий определенных для конкретной базы. Проверка происходит через выполнение динамического кода, формирование условий возможно как напрямую кодом, так и средствами автоматической генерации кода на основе отборов СКД.
Обращение к показателю "Захвачено СУБД" средствами взаимодействия с RAS не возможно, RAS просто не возвращает этот показатель. Но есть "Длительность текущего вызова СУБД" который покрывает часть потребности аналогично показателю длительности транзакции "Захвачено СУБД"
2. Завершение сеансов ответом на сообщение бота
Для завершения сеанса инициатора события повлекшего за собой алерт, необходимо ответить на сообщение командой "kill" или "килл" и сеанс будет завершен, о чем бот спустя некоторое время оповестит.
3. Мониторинг журналов регистрации.
Работает через clickhouse, используется библиотека экспорта от Евгения Акпаева, с небольшой доработкой в части 99 попыток отправки в Clickhouse, т.к. бывало что экспорт падал в моменты, когда потребление ОЗУ на сервере Clickhouse было максимальным, не особо понравилась идея увеличивать общий объем ОЗУ на машине, ради 3-4 итераций в 2-3 месяца, когда нужно построить большую аналитику по ЖР.
В рамках работы регламентного задания, осуществляется выполнение запросов к подключенному серверу Clickhouse, в случае возвращения данных, алерт считается сработавшим и регистрируется сообщение к отправке, которое может включать в себя файл с ответом сервиса.
4. Анализ ошибок журнала регистрации
Отдельное регламентное задание для базы.
Предоставляет выжимку информации из журнала регистрации в нескольких разрезах:
1. Ошибки с начала текущего дня, сгруппированное представление ошибок за текущий день, с возможностью разворота группировки (отображается последние 100 событий в группе)
2. Новые ошибки (в сравнении со вчерашним днем)
3. Приращение количества ошибок по событиям.
Сравнение количества ошибок текущего дня с теми что были в это время вчера.
4. Погашенные ошибки.
Были вчера в это время - сегодня отсутствуют.
5. Мониторинг выполнения регламентных заданий.
Регламентное задание, получающее информацию средствами внешнего соединения.
Мониторит кейсы:
1. Аварийное завершение
2. Отменено
3. Не выполнено по расписанию
Так же прикладывает более подробную информацию об ошибках вложенным файлом.
Функционал работает в тесной интеграции с телеграм ботом.
5.1. Из бота есть возможность подписаться на падения определенных регламентных заданий.
Другие мои публикации:
Смещение границ итогов в больших регистрах накопления
Порционный шринк баз данных