Автоматическая классификация ошибок технологического журнала

25.06.20

В статье обсудим пример практической настройки конфигурации «Мониторинг производительности» для автоматической классификации ошибок по группам/кластерам на данных текстов описания ошибок. Используем механизм векторной модели текстов и косинусное сходство между ними.

Промо:

анализировать технологический журнал вручную долго, а в реальном времени практически невозможно для даже слабеньких систем, это все должно быть автоматизировано;
автоматическая классификация текстов ошибок;
автоматическое формирование и рассылка сообщений по аварийным и критическим ситуациям на основе анализа логов;
у Вас появилась возможность использовать частичную функциональность систем искусственного интеллекта здесь и сейчас.

Описание проблемы:

Сложность анализа и постоянный контроль - При анализе текстов записей технологического или регистрации журналов Вам требуется оперативный анализ по категориям/классам: блокировка, ошибка доступа, программного кода или еще что-то. Вычленить понятие события из текста содержащего кучи GUID, стека вызовов и всяких там технических терминов – сложная и трудоемкая задача. Просмотреть (часто большой текст сообщения) можно вручную (не оперативно) если этих событий 10 или 100, но вот если их более чем 1000, да еще и каждый час, то этот набор сырых данных превращается в китайскую грамоту, и мы быстро начинаем уставать – терять сосредоточенность, что-то пропускать, игнорировать и т.д.
Оперативность реагирования - Требуется максимально оперативно узнать, что появилось критическое сообщение в журнале и поставить алармы/ярлычки на какие-то определенно встречающиеся опасные события/сообщения в технологическом журнале. К примеру, новая неизвестная ошибка (особенно уместно после обновления конфигурации) или сообщения падения хостов, агента, СУБД – типа «На сервере 1С:Предприятия не найдена лицензия. Не обнаружен ключ защиты программы или полученная программная лицензия!», «Процесс завершается. Исходящий вызов запрещен» или «Сервер недоступен (Не отвечает, завершается аварийно или порт занят другим приложением)».

Если все это Вам требуется - то эта статья с практикой применения для Вас.

Небольшой флешбек:

Вопрос автоматической классификации ошибок был поставлен у нас еще до появления самой конфигурации. Однако основная и первичная задача стояла в автоматическом мониторинге состояния системы в облаке и сообщении о проблемах производительности. Эти задачи на текущий момент решены и улучшаются время от времени. Теперь поговорим о варианте выполнения автоматической классификации ошибок. Информацию по данной тематике мы преподнесем в двух публикациях. В первой и текущей публикации мы кратко коснемся вопроса теории, а во второй более подробно остановимся на этом важном, на взгляд авторов аспекте.
Скажем сразу фактически никаких иных инструментов, кроме 1С, т.е. никакого зоопарка из кучи инструментов типа python и т.п. мы не использовать не будем)

Задача:

Отнести текстовое сообщение об ошибке на основе данных технологического журнала к одному из заранее определенных классов.

В качестве математики будем использовать механизм преобразования текстов в векторное пространство и косинусное сходство.

Структура статьи:

Настройки и порядок выполнения работ
Видео-урок
Замечания, советы, ссылки.

I) Практика

1 Шаг. Скачиваем необходимые ресурсы

А) Скачиваем обновленную конфигурацию «Мониторинг производительности» и обработку «АвтоматическаяКлассификацияОшибокВекторноеПространство.epf». Устанавливаем конфигурацию, если еще не стоит.

Б) Добавляем обработку в дополнительные отчеты и обработки. Подсистему выбираем «Замеры».

В) Выполняем настройку загрузки логов ошибок технологического журнала (если не делали ранее) - 5 простых шагов и 15 минут на разворачивание инструмента мониторинга проблем производительности базы 1С

2 Шаг. Заполняем классификатор ошибок.

Открываем справочник "Известные ситуации" в подсистеме "Замеры". Создаем корневой элемент и называем его "Классификатор ошибок ТЖ". А далее создаем набор справочников в соответствии с примером ниже.

Опорные тексты кластеров приведены внутри каждого класса. Обязательно выполняйте настройку под себя изменяя/регулируя тексты, и значения нижней границы. Общий совет - чем меньше текст кластерам и мало в нем уникальных слов, то тем выше необходимо поднимать границу.

Доступ – ошибка доступа, права и роли. Нижняя граница сходства > 0.1

Роль, права, доступ, пользователь, пользователи
У пользователя недостаточно прав на исполнение операции над базой данных
Недостаточно прав на изменение реквизитов в документе
Недостаточно прав для просмотра
Недостаточно прав для работы с таблицей
Нарушение прав доступа!
Ошибка разделенного доступа к базе данных
Ошибка в ограничении доступа к данным
Data access restriction error
Идентификация пользователя не выполнена. Неправильное имя или пароль пользователя
Запись/проведение – ошибки записи документов, справочников, регистров и проведения документов. Нижняя граница сходства > 0.1

Документ, справочник, регистр сведений, регистр накопления, план обмена
Запись, проведение, удаление, пометка на удаление, отмена проведения
Не удалось провести
Не удалось записать
Failed to save
Запись не верна! Период не может быть пустым!
Номер строки
Данные были изменены или удалены другим пользователем
Операция не может быть выполнена из-за несоответствия версии или отсутствия записи базы данных (возможно, запись была изменена или удалена)!
Запись с такими ключевыми полями существует!
Ввод на основании непроведенного документа запрещен
Блокировки – блокировка документов, действий, форм. Нижняя граница сходства > 0.1

Блокировка, заблокировать
Не удалось заблокировать
Ошибка блокировки объекта. Объект уже заблокирован
Конфликт блокировок при выполнении транзакции. Неустранимый конфликт блокировок
Превышено максимальное время ожидания предоставления блокировки
В данной транзакции уже происходили ошибки
Lock request time out period exceeded
Transaction was deadlocked on lock resources with another process and has been chosen as the deadlock victim. Rerun the transaction
СУБД – ошибки взаимодействия сервера 1С с базой данных. Нижняя граница сходства > 0.1

Запрос невозможно исполнить
Длина шаблона поиска превышает максимально возможную для используемой СУБД
Microsoft SQL Server Native Client
Ошибка СУБД
Ошибка SDBL
Could not allocate space for object temporary run storage because the filegroup is full. Create disk space by deleting unneeded files, dropping objects in the filegroup, adding additional files to the filegroup, or setting autogrowth on for existing files in the filegroup.
User does not have permission to use the KILL statement.
The COMMIT TRANSACTION request has no corresponding BEGIN TRANSACTION
Работа с отчетами – ошибки, связанные с формированием, выполнением отчетов. Нижняя граница сходства > 0.2

Отчет, вариант отчета, макет
Скомпоновать, СкомпоноватьРезультат
компоновке результата, ОтчетОбъект, СформироватьОтчет
Ошибка компоновки макета
Невозможно применить элемент отбора
Ошибка исполнения отчета
Ошибка при выводе результата
Ошибка при исполнении запроса набора данных
Ошибка создания набора данных
Программные – ошибки, связанные с выполнением различного кода. Нижняя граница сходства > 0.08

Неверные параметры в операции сравнения
Операции сравнения на больше-меньше допустимы только для значений совпадающих примитивных типов (Булево, Число, Строка, Дата)
Неверные параметры в операции сравнения. Нельзя сравнивать поля неограниченной длины и поля несовместимых типов
Преобразование значения к типу Булево не может быть выполнено
Преобразование значения к типу Число не может быть выполнено
Значение индекса выходит за границы диапазона
Индекс находится за границами массива
Ошибка при вызове метода контекста
Ошибка при выполнении операции над данными. Divide by zero error encountered
Синтаксическая ошибка
Поле объекта не обнаружено
Ошибка при получении значения атрибута контекста
Ошибка при установке значения атрибута контекста
Ошибка выполнения запроса
Ошибка при выполнении обработчика
Неверный первый параметр
Ошибка установки значения свойства. Недопустимое значение
Ошибка формата потока. Ошибка преобразования данных XDTO.
Недостаточно фактических параметров
Метод объекта не обнаружен
Процедура или функция с указанным именем не определена
Не задано значение параметра
Не установлено значение параметра
Ошибка обработки представления
Невозможно применить элемент отбора
Недопустимое значение
Непредвиденный символ при чтении JSON
Работа с интернет – не удалось получить данные, превышено ожидание и др. Нижняя граница сходства > 0.2

HTTPСоединение, АдресРесурса
Не удалось получить данные проблема соединения. Ответ сервера: 301, 302, 401, 404, 408, 500
HTTP: Expectation failed
HTTP: Bad request
HTTP: Not found
HTTP: Method not allowed
Ошибка работы с Интернет: Не могу установить соединение
Не удалось проверить в сервисе. Не удалось подключиться к сервису
Критические ошибки авария (элемент группы) – падение хостов, отсутствие лицензий, отказ служб и т.п.
1. Авария служб 1С. Нижняя граница сходства > 0.2
  
  Процесс завершается. Исходящий вызов запрещен
  Сервер недоступен (Не отвечает, завершается аварийно или порт занят другим приложением)
  No connection could be made because the target machine actively refused it
  An existing connection was forcibly closed by the remote host
  База данных не обнаружена. База данных отсутствует в сервере баз данных. Не найдена база данных.
  Соединение с сервером баз данных непригодно для использования после разрыва соединения администратором и будет переустановлено
  Недостаточно свободной памяти для выполнения операции
  На сервере 1С:Предприятия произошла неисправимая ошибка. Приложение будет закрыто
2. Лицензии. Нижняя граница сходства > 0.2
  
  На сервере 1С:Предприятия не найдена лицензия. Не обнаружен ключ защиты программы или полученная программная лицензия!
  Не найдено ни одного сервера с размещенным сервисом
  Локальный ключ недоступен
  Локальный, не установлен
  Файл программной лицензии не найден
  Поиск лицензии в сервисе лицензирования
  Ошибка вызова сервиса лицензирования
3. Разрывы соединения. Нижняя граница сходства > 0.2
  
  Session closed by administrator
  Соединение с сервером баз данных разорвано администратором
  Выполнение оператора KILL не привело к ошибке СУБД
Разное – все остальные ошибки, не вошедшие в предыдущие классы

Выбранная версия объекта отсутствует в программе
Операция не может быть выполнена из-за несоответствия версии или отсутствия записи базы данных (возможно, запись была изменена или удалена)!
Файл не обнаружен
Невозможно открыть файл, удален
Ошибка при выполнении файловой операции
Ресурс не найден
Не удалось выполнить данную операцию. Подробности в Журнале регистрации

3 Шаг. Выполняем настройку обработки

А) Открываем форму "Настройка 'Автоматическая классификация ошибок ТЖ'" дополнительной обработки.

Б) Указываем параметры обработки текстов. Это так называемая процедура подготовки данных для анализа. Настройки можно выполнить согласно рисунку ниже.

В) Указываем стоп слова/ стоп фразы/ синонимы (можете пропустить, если не знаете как и зачем)
Г) Указываем источники для получения данных и выполнения обработки (вкладка 'Данные из базы'/'Выбрать данные из базы'). Обычно это ссылка на замер и свойство 'Descr'.
Д) Используем текстовые данные с текстовым корпусом ошибок из файла или на основе данных базы. Это вкладка "Данные из базы"/"Выбрать данные из классификатора". Жмем кнопку "Выбрать данные из классификатора".
Е) Переходим к формированию базиса и векторного пространства ошибок технологического журнала. Вкладка "Базис".

Ж) Формируем базис данные для классификации. Последовательно нажимаем кнопки "Получить частотность", "Сформировать вектора", "Рассчитать векторное пространство".

З) Сохраняем настройки в замер.

4 Шаг. Выполняем проверку и настройку.

Выполняем оценку качества классификации.

А) Выбираем набор проверочных данных (вкладка 'Данные из базы'/'Выбрать данные из базы'). Жмем "Выбрать данные" (используем период и первые - иначе будет очень долго и тяжело).

Б) После на вкладке "Обработка текста" жмем кнопки последовательно - "Обработать текст", "Заполнить таблицу корпуса слов по текущему тексту".

В) Формируем вектора текстов. На вкладке "Базис". Жмем последовательно кнопки - "Сформировать вектора", "Рассчитать векторное пространство по классификатору".

Г) Переходим на вкладку "Проверка"/"Автоклассификация" формы настройка и выполняем авто классификацию - жмем кнопку "Выполнить автоматическую классификацию по классификатору".

Д) Вычисляем количество верных оценок, принимаем решение о дальнейшей настройки или завершении настроек.

Качество результата обработки можно получить по формуле:

Качество классификации = 100% * Количество правильных классификаций / Количество примеров.

Настройку необходимо производить до уровня не менее 95%. Оптимально - 98-99%.

5 Шаг. Запуск в работу!

Запускаем регламентное задание автоматической классификации. На вкладке замера загрузки логов можно увидеть результаты классификации в колонке "decision"

Открываем форму "Монитор 'Классификация ошибок'" анализа данных или журнал замеров и смотрим результат.

II) Видео-урок.

III) Замечания:

Чем качественнее составлен базовый вектор (базис слов), тем лучше будет результат. Т.е. если вы поленитесь убирать мусорные слова типа имен пользователей, комментариев и т.п. тем хуже будут результаты.
При появлении новых ошибок вам понадобится перестроить словарь – дополнить. Критерием этого будут служить появление новых не классифицированных ошибок.
Аккуратно пользуйтесь важностью слов, т.к. этот критерий будет увеличивать влияние данных слов на результат.
Формирование классификатора на основании текстов можете использовать для общей группировки, а далее формируйте руками.
Рекомендуем граничный критерий схожести установить в диапазоне от 0,8-0,86 до 1 (это соответствует радиусу между векторами от 36-30 до 0). При значении косинуса близком к 1 можно сказать, что вектора одинаково направлены на 100% - это максимальное подобие. При значениях в районе 0 или отсутствии – означает, что совсем различны.
Уточните и заполните Стоп-слова и Синонимы фраз. Это позволит очистить результат от шума и сделать результат классификации гораздо лучше.
Анализировать данные по темам можно для любой текстовой информации, которую можно добавить в замеры – данные об инцидентах пользователей, письмах на поддержку и т.п.
Советуем не делать большой базис слов – не более 800-1000 слов. Если у Вас получилось больше, значит у вас много лишних понятий. Проведите чистку.
Для классификатора корпус текстов ошибок тоже не должен быть большим. Оптимально 5-15. К примеру: «Отчеты», «Проведение/запись документов/справочников», «Доступ», «Блокировки», «Ошибки сервисов»...

Ссылки:

Фреймворк «Монитор производительности»
Руководство по эксплуатации.
АвтоматическаяКлассификацияОшибокВекторноеПространство.epf
Готовую конфигурацию можно скачать из приложения статьи: Решение проблемы быстродействия в ERP на рабочем примере

Вступайте в нашу телеграмм-группу Инфостарт

производительность мониторинг технологический журнал классификация

+60 –

См. также

Мониторинг ландшафта 1С с использованием современных практик

Мониторинг Журнал регистрации Технологический журнал Системный администратор Программист Бесплатно (free)

Мониторинг в ландшафте 1С помогает не только вовремя выявлять проблемы и повышать SLA, но и укреплять информационную безопасность. Разбираем источники данных, ограничения штатных инструментов и современные практики мониторинга на базе Prometheus, ClickHouse и Grafana. А также рассказываем о коробочном решении «Оркестратор 1С-систем» и планах его развития.

29.10.2025 723 Sibars 0

Веб-приложение для создания конфигурационного файла технологического журнала

Технологический журнал Программист Россия Бесплатно (free)

Logcfg editor — это удобное веб-приложение, предназначенное для создания конфигурационного файла logcfg.xml для системы логирования в 1С:Предприятие. Приложение позволяет настраивать параметры логирования через интуитивно понятный интерфейс, избавляя от необходимости вручную редактировать XML-файлы.

25.08.2025 2128 Metrika42 3

Конвертер технологического журнала в новый формат

Технологический журнал Системный администратор Программист 1С v8.3 Абонемент ($m)

Утилита для конвертирования Технологического журнала из текстового формата в JSON.

1 стартмани

28.07.2025 2396 0 SerVer1C 2

OpenSearch для 1Сников. Как использовать бесплатный ElasticSearch, не теряя времени, нервы и качество

Технологический журнал Системный администратор Программист Бесплатно (free)

Чтобы организовать детальный произвольный анализ огромного количества логов технологического журнала, нужен удобный инструмент. Расскажем о том, как с помощью бесплатного решения OpenSearch настроить оповещения в Telegram и на почту об изменениях настроек на сервере 1С, а также дашборды, позволяющие мгновенно находить проблемные объекты и источники блокировок.

24.07.2025 6773 aidar_safin 2

Автоматизация сбора данных по проблемам производительности 1С для проведения диагностики в одном окне

HighLoad оптимизация Рефакторинг и качество кода Технологический журнал Программист 1С v8.3 Россия Бесплатно (free)

Технологии бегут вперёд, но боль производительности 1С остаётся вечной: инфраструктура, код или настройки? Пока ИИ не научился чинить всё «на лету», мы автоматизировали ключевое — диагностику. Читайте статью — показываем, как превратить хаос диагностики в понятные графики и цифры. Спойлер: это работает даже если ваша 1С — «чёрный ящик» на старом железе.

19.03.2025 6246 Metrika42 9

Как посмотреть запрос 1С в PostgreSQL

Технологический журнал Механизмы платформы 1С Запросы Программист Запросы Бесплатно (free)

Существуют различные методики и инструменты просмотра запроса 1С в PostgreSQL. В этой статье мы разберём подробнее метод анализа запроса 1С на стороне PostgreSQL с помощью технологического журнала платформы 1С и команд в терминале Ubuntu.

04.03.2025 3442 user593895_gurov-boris-spb 6

Почему на Postgres запросы выполняются дольше при включении plansql в технологическом журнале?

HighLoad оптимизация Запросы Технологический журнал Программист 1С v8.3 Бесплатно (free)

Рассмотрим логику выполнения запросов платформой 1С к СУБД при включенной настройке ТЖ.

27.11.2024 2261 Tantor 10

Кейс: TCP Provider: An existing connection was forcibly closed by the remote host

HighLoad оптимизация Технологический журнал Сервера Системный администратор Программист 1С v8.3 1С:ERP Управление предприятием 2 Россия Бесплатно (free)

Неожиданные результаты расследования ошибки "TCP Provider: An existing connection was forcibly closed by the remote host".

29.10.2024 3742 PerlAmutor 1

Комментарии

Подписаться на ответы Инфостарт бот

Свернуть все

1. Yashazz 4885 28.06.20 12:11 Сейчас в теме

Блестяще. Отличная публикация, подробное, понятное изложение, готовые примеры. Серьёзное решение серьёзной проблемы. Солидно. Полезно. Большое спасибо!

2. ivanov660 4859 28.06.20 14:43 Сейчас в теме

(1)Спасибо, такой отзыв очень приятно читать )
Будет полезно, если кто-то настроет у себя такой функционал и поделется результатами.

Что самое замечательное в этом механизме - используем только возможности 1С Платформы.

6. Yashazz 4885 29.06.20 10:54 Сейчас в теме

(2)

Что самое замечательное в этом механизме - используем только возможности 1С Платформы.

Именно. Это одно из несомненных достоинств.

3. Артано 800 29.06.20 07:15 Сейчас в теме

Отличная работа, коллеги. Если не возражаете, то вставлю вашу прикладную статью как иллюстрацию для моей теоретической, чтобы жаждущие смогли сразу увидеть как теория реализуется в практике.

4. ivanov660 4859 29.06.20 08:22 Сейчас в теме

(3)Не против.

5. Артано 800 29.06.20 09:01 Сейчас в теме

(4) Об ошибках, просто вопрос парсинга журнала у меня лишь в двух предложениях описан, а здесь прекрасная иллюстрация.

7. kiset 03.07.20 09:49 Сейчас в теме

Отличный проект. Довольно легко настраивается, и адекватный результат.

Вопрос: это так и задумано, что при подключении замера через произвольный тип, нигде не прописана загрузка самих логов по этому замеру, или я до чего-то не докопался?

8. ivanov660 4859 03.07.20 10:04 Сейчас в теме

(7)Если вы выбираете произвольный тип, то должны указать дополнительную обработку. Эта дополнительная обработка должна содержать в себе код для загрузки/обработки данных.
Добавлю в инструкцию.
Т.е. ТЖ и Performance Monitor из коробки, остальные подключаются дополнительными обработками - плагинами.
ДУмаю, что должен ответить на вопрос.

9. kiset 03.07.20 10:15 Сейчас в теме

(8)

Эта дополнительная обработка должна содержать в себе код для загрузки/обработки данных.

Собственно, про это и вопрос. Обработка "АвтоматическаяКлассификацияОшибокВекторноеПространство.epf" не содержит такого кода, по крайней мере, я пока его не нашёл.

В общем-то допилить это не составляет труда, но может мало ли, я слепой и плохо искал? :)

10. ivanov660 4859 03.07.20 11:58 Сейчас в теме

(9)
1 Содержит код обработки данных. Это вам я как автор говорю). Чтобы обрабатывать данные Вам требуется обязательно создать отдельный замер загрузки ТЖ. Данный пункт инструкции в тексте статьи и есть ссылка в ролике.
Если вы хотите в одном флаконе: загрузку лога ТЖ, обработку лога ТЖ, оповещения по результатам обработки и т.п. тогда "напильник вам в руки".
"Загрузки/обработки" - я написал потому, что функционал в рамках обобщенного замера различный. А в случае текущей обработки - выполняется только обработка данных (классификация)
2. Если у вас что-то не работает или работает не так, то значит вы что-то не верно делаете или не внимательно посмотрели пример настройки (такое бывало уже не раз, всем нам свойственно).
3. Возможно вы выполняете не регламентированную последовательность действий или настроек окружения. Напишите если это так, тогда нам стоит, исправить или ограничить такую возможность.

11. kiset 03.07.20 12:56 Сейчас в теме

(10)

Вам требуется обязательно создать отдельный замер загрузки ТЖ. Данный пункт инструкции в тексте статьи и есть ссылка в ролике.

Спасибо за разъяснение. Ответ на вопрос получен, так и задумано. :)

12. ivanov660 4859 03.07.20 13:58 Сейчас в теме

(11) Принцип - собираем из "кубиков" необходимую конструкцию.

13. user612295_death4321 06.02.21 22:44 Сейчас в теме

Вашу разработку конечно не использовал, но идея парсинга ТЖ на предмет программных ошибок мне очень понравилась)

Предлагаю дополнить "Значение не является значением объектного типа"

14. Bahrad 14.09.24 11:57 Сейчас в теме

При нажатии на кнопку "Выполнить автоматическую классификацию по классификатору" появляется ошибка

Прикрепленные файлы:

15. ivanov660 4859 09.10.24 22:27 Сейчас в теме

(14)
1. Выглядит достаточно странно, вы точно выбрали классификатор? Проверьте правильность всех шагов и заполнения данных.
2. Почему бы не воспользоваться упрощенным режимом?
3. Пишите об ошибке на git проекта, как задачу об ошибке

Для отправки сообщения требуется регистрация/авторизация

Автор:

Владимир Крючков (ivanov660)

Рейтинг: 4859

Для получения уведомлений о новых публикациях автора подключите телеграм бот: Инфостарт бот

Публикация:

№ 1251023

Создание 25.06.20 15:00

Обновление 25.06.20 15:00

Статистика:

Просмотры 13006

Загрузки 0

Рейтинг 60

Комментарии 15

Характеристики:

Код открыт Да

Рубрики Технологический журнал

Кому Системный администратор

Тип файла Нет файла

Платформа 1С v8.3

Конфигурация 1C:Бухгалтерия

Операционная система Не имеет значения

Страна Не имеет значения

Отрасль Не имеет значения

Налоги Не имеет значения

Вид учета Не имеет значения

Доступ к файлу Бесплатно (free)