Периодическая загрузка событий из журналов регистрации в базу MS SQL Server (с исходниками)

Публикация № 182820

Администрирование - Журнал регистрации

90
Еще один вариант парсера файлов журнала регистрации для 8.2.
Преимущества:
1) Читает файлы напрямую, что дает высокую скорость.
2) Знает, где остановилось чтение в прошлый раз, и начинает с этого места при следующем запуске.
3) Может работать и как windows-служба, и как обычное приложение.

Приложение написано на .NET 2.0.

Порядок работы:

1) На сервере MS SQL создать пустую базу данных.

2) На сервере приложений 1С, из БД которого нужно грузить события, под административными правами запустить EventLogLoaderManager.exe

3) Указать строку соединения с базой.

Можно использовать шаблоны:
для windows-авторизации Data Source=MSSQL1;Server=имя сервера;Database=имя базы;Integrated Security=true;
для обычной авторизации  Data Source=MSSQL1;Server=имя сервера;Database=имя базы;Password=Пароль;User ID=Имя пользователя;

4) Указать интервал между циклами чтения событий из ЖР. Допустимо ставить несколько секунд - на производительности сервера не скажется.

5) Отметить те БД, события из которых необходимо периодически загружать в базу.

6) Нажать «Сохранить параметры», при этом в каталоге программы создается файл настроек setting.ini

7) Если нужна периодическая загрузка – нажимаем «Установить службу», ищем в списке служб «EventLog loader service» и исправляем аккаунт, от имени которого будет работать служба. Если строка соединения содержит логин и пароль, то можно ничего не менять, если нет, то службу нужно запускать от имени правильной учетной записи windows, которая имеет полные права на SQL-базу с событиями.

8) Если нужна разовая загрузка – запускаем из каталога программы EventLogLoader.exe. Следует учесть, что это приложение, как и служба, работает в бесконечном цикле (проверяет новые события, пишет их в базу, делает паузу, затем повторяет заново), поэтому прерывается она при нажатии любой кнопки мыши.

 

 

Некоторые особенности

1)      Для каждой ИБ журнал регистрации грузится в отдельном потоке. Если начнете грузить по сотне баз, то велика вероятность на начальном этапе повесить сервер. В дальнейшем, если проверять новые события достаточно часто (например, каждые 10 секунд), то служба быстро их записывает в базу без особой загрузки сервера.

2)      Если загрузку прервать, то при повторном запуске она продолжится с места остановки (позиция сохраняется в БД).

3)      Таблицы в БД создаются автоматически. Если вы удалили какая-нибудь таблицу - надо перезапустить службу.

4)      Все события по всем ИБ хранятся в одной таблице. Разделитель – колонка «Код информационной базы».

5)      Логи с ошибками хранятся в каталоге программы в папке «log».

6)      Работает только с платформой 8.2 (файлами lgf и lgp).

7)      В таблицах созданы только основные кластерные индексы по полю "Код информационной базы". Для ускорения запросов, которые вам требуются регулярно, нужно добавлять свои индексы.

8)      Несколько полей осталось нераспознанными (Field2, Field7, Field8). Если вам известно их назначение - сообщите, пожалуйста.

 

Описание таблиц

 

1) Infobases - список обрабатываемых ИБ. Код генерируется автоматически при добавлении новой базы в этот список. Эти же коды определяют принадлежность записей в определенной ИБ во всех других таблицах.

2) Params - хранит последние прочитанные файлы и позиции в них.

3) Назначение остальных таблиц понятно из их названия. Итоговая таблица  с событиями с присоединенными справочниками

SELECT     TOP (1000) Infobases.Name, Events.DateTime, Events.TransactionStatus, Events.TransactionStartTime, Events.TransactionMark,
                     
Users.Name AS [User], Computers.Name AS Computer, Applications.Name AS App, Events.Field2, EventsType.Name AS EventType,
                     
Events.EventType, Events.Comment, Metadata.Name AS Metadata, Events.DataStructure, Events.DataString,
                     
Servers.Name AS [Server], MainPorts.Name AS MainPort, SecondPorts.Name AS SecondPort, Events.Seance
FROM         Events INNER JOIN
                     
Applications ON Events.InfobaseCode = Applications.InfobaseCode AND Events.AppName = Applications.Code INNER JOIN
                     
Computers ON Events.InfobaseCode = Computers.InfobaseCode AND Events.ComputerName = Computers.Code INNER JOIN
                     
EventsType ON Events.InfobaseCode = EventsType.InfobaseCode AND Events.EventID = EventsType.Code INNER JOIN
                     
Infobases ON Events.InfobaseCode = Infobases.Code INNER JOIN
                     
Users ON Events.InfobaseCode = Users.InfobaseCode AND Events.UserName = Users.Code INNER JOIN
                     
SecondPorts ON Events.InfobaseCode = SecondPorts.InfobaseCode AND Events.SecondPortID = SecondPorts.Code INNER JOIN
                     
Servers ON Events.ServerID = Servers.Code AND Events.InfobaseCode = Servers.InfobaseCode INNER JOIN
                     
MainPorts ON Events.InfobaseCode = MainPorts.InfobaseCode AND Events.MainPortID = MainPorts.Code INNER JOIN
                     
Metadata ON Events.InfobaseCode = Metadata.InfobaseCode AND Events.MetadataID = Metadata.Code

 

Объемы получаемой информации

Хранение структурированных данных более затратное с точки зрения требуемого места на дисках.
Иными словами - объем базы данных будет существенно больше суммы объемов всех ЖР, которые были обработаны и загружены.

Реальный пример:

2 информационные базы с объемом ЖР 2132 Мб (1192+971).  Время первичного разбора в 2 потока (т.к. базы 2) - около 1,5 часов.

Общее количество событий - 19'507'484 млн.

Объем базы на MS SQL Server - 12879 Мб, т.е. примерно в 6 раз больше!

НО - если применить сжатие таблиц, как, например, описано здесь, то получим 1610 Мб, т.е. даже меньше исходных данных.
К сожалению, не все версии MS SQL Server поддерживают сжатие.

 

90

Скачать файлы

Наименование Файл Версия Размер
Приложение
.zip 314,56Kb
13.04.13
122
.zip 314,56Kb 122 Скачать
Исходники
.zip 1,88Mb
06.06.14
55
.zip 1,88Mb 55 Скачать

См. также

Специальные предложения

Комментарии
Избранное Подписка Сортировка: Древо
1. aspirator23 387 17.04.13 07:22 Сейчас в теме
Спасибо, как всегда интересная нестандартная публикация.
Работа с журналами в больших базах - это всегда хлопотное дело.
2. Антон Ширяев 448 17.04.13 08:52 Сейчас в теме
Безусловно программа полезна, но считаю совсем некорректным не ссылаться на мои публикацию - http://infostart.ru/public/182061/ - Формат файлов журнала регистрации 1С 8.1/8.2 - ELF/LOG/LGF/LGP и http://infostart.ru/public/181455/ - Анализ и редактирование файлов журнала регистрации 1С 8.1/8.2 - ELF/LOG/LGF/LGP

Возможно конечно вы их вовсе не использовали в своей работе, но как минимум в них заходили и даже скачивали файл АнализФайловЖурналаРегистрации_1_0.epf, поэтому не знать о них не могли.
3. Aleksey.Bochkov 3094 17.04.13 10:06 Сейчас в теме
(2) - программа была разработана ранее ваших публикаций, но только сейчас дошли руки оформить ее в нормальном виде. Плюс - она же бесплатная.
Вот если бы я использовал ваши разработки для коммерческой версии, тогда претензия была бы обоснована.
Прикрепленные файлы:
michmich; RegrZ; hazyaka; +3 Ответить
4. cool.vlad4 44 17.04.13 10:31 Сейчас в теме
(3) с вашими знаниями вы вполне могли использовать File.SetCreationTime ;)
Прикрепленные файлы:
5. Aleksey.Bochkov 3094 17.04.13 10:51 Сейчас в теме
(4) вот предыстория. Так убедительнее? :)
Прикрепленные файлы:
kirillkr; +1 Ответить
6. Антон Ширяев 448 17.04.13 12:51 Сейчас в теме
(3)
тогда претензия была бы обоснована

Претензии не было, было указано лишь на то, что некорректно не ссылаться на публикации которые перекликаются с вашей, т.к. до этого на Инфостарте не было публикаций где применялось прямое чтение файлов журнала регистрации.
Ну и конечно же это ваше дело, но раз уже был разобран формат файлов журнала регистрации, то могли бы и оставить свои комментарии к моим публикациям, например что в 8.2 значат справочники 11, 12 и 13, встречаются ли другие справочники, всегда ли последней колонке {0}, как корректно разбирать {"P",...
7. Valet 56 02.05.13 23:20 Сейчас в теме
(0)Приложите обработку для просмотра ЖР на SQL из 1С, тогда это будет законченное решение.
Да, многим не составит труда её саму написать, но лень/некогда/немогу(нужное подчеркнуть) и другие причины уменьшают количество потенциальных пользователей.
hazyaka; METAL; the_master; +3 Ответить
8. kiruha 374 06.06.14 09:53 Сейчас в теме
Насколько сказывается работа этой программы на производительности основной базы ?
Возможен ли вариант блокировок и т.п. ?
9. Aleksey.Bochkov 3094 06.06.14 11:39 Сейчас в теме
(8) kiruha,
Насколько сказывается работа этой программы на производительности основной базы ?

Приложение никак не взаимодействует с основной базой. Данные читаются из файлов на сервере приложений 1С.
Но вычислительная нагрузка, конечно присутствует. Если баз несколько, то ее будет незаметно. Если же запустить загрузка ЖР сразу из сотни - какую-то существенную долю процессора и дисков приложение съест.
Возможен ли вариант блокировок и т.п. ?

Нет.
10. adapter 495 06.06.14 15:23 Сейчас в теме
А что потом делать с этими данными в SQL ? как отобрать все записи об изменении приходной накладной №000345 ? или выбрать все что ввела за сегодня Маша Иванова? Сравнить с Таней Петровой? Информация имеет смысл если ее можно легко обработать.
11. Aleksey.Bochkov 3094 06.06.14 15:48 Сейчас в теме
(10) adapter,
Алгоритм тут будет очень похож на тот, который вы бы сделали для решения аналогичной задачи с журналом регистрации внутри 1С.
Идентификаторы пользователей и объектов метаданных есть. ГУИДы объектов также. Пишите правильный запрос и получите правильные данные :).
Вот тут есть хороший вариант применения - http://infostart.ru/public/182833/. Решается, казалось бы, легкая задача, но на самом деле совсем нетривиальная (т.к. в 1С до сих пор нет нормальных штатных инструментов для получения реальной длительности записи и проведения документов, точнее, длительности транзакций).

Но я бы сказал так - инструмент предназначен скорее всего для тех, кто понимает - что потом с этими данными в SQL делать :).
14. vis_tmp 28 05.02.15 11:56 Сейчас в теме
(11) Алексей, будет ли программа корректно отрабатывать в случае удаления файла журнала регистрации.
Ситуация следующая: имеем файл журнала регистрации большого объёма, начали пользоваться вашей программой.
Потом решили этот большой файл удалить, чтобы он начался заново.
Программа будет переносить записи уже из нового файла и добавлять их к уже имеющимся в SQL ?
15. Aleksey.Bochkov 3094 07.02.15 01:45 Сейчас в теме
(14) vis_tmp,
Позиция, с которой необходимо продолжать чтение в журнале регистрации, хранится в разрезе имен файлов.
Т.е. если файл будет удален то 1С создаст новый с новым именем, а чтение начнется с начала и записи будут добавляться к уже имеющимся.

Кстати, у меня уже новая версия есть.
- добавил загрузку из нового формата журнала регистрации 8.3 (SQLite)
- добавил возможность загрузки событий в MySQL базу данных.
- менеджер настроек теперь отображает файловые базы пользователя, также можно добавить путь вручную.
- исправил пару ошибок в загрузке событий.

Бинарники во вложении, публикацию обновлю позже.
Но я не тестировал на 32-разрядной системе..
Прикрепленные файлы:
1.1.2.1.zip
25. farukshin 84 01.09.16 12:00 Сейчас в теме
(10) adapter,
А что потом делать с этими данными в SQL ?


Как вариант - анализ и визуализация данных в ElasticSearch http://infostart.ru/public/545895/
12. chmv 27.06.14 15:12 Сейчас в теме
13. newgluk 81 24.09.14 09:54 Сейчас в теме
в MS SQL 2012: (ERROR): Ошибка получения ID ИБ из БД (mybase). System.Data.SqlClient.SqlException: Invalid object name 'dbo.Infobases'.
Или это я с правами не разобрался?
16. dimon_upi 06.04.15 08:36 Сейчас в теме
Спасибо большое. Очень полезно, давно сам хотел сделать, но уж больно много вкусностей вы положили в свою работу.
17. xinex 28.09.15 15:29 Сейчас в теме
Алексей, периодически останавливается загрузка данных ЖР в базу.
ПО EventLogLoader грузит ядро процессора на 100%, но данные в SQL не пишет.

Спасибо за данное ПО, сильно помогает в работе.

upd:

Нашел причину. EventLogLoader не может корректно обработать события, где очень большой коментарий:
{20140917161102,N,
{0,0},129,1377,4,5280,32,E,"{ОбщийМодуль.Название.Модуль(1467)}: {""#"",e199ca70-93cf-46ce-a54b-6edc88c3a296,
{#base64: здесь 323КБ символов в 9800 строках
}
}",0,
{"S","Расчет завершен."},"",1,14,2,10485,0,
{0}
}
18. milanse 32 19.11.15 16:23 Сейчас в теме
Привет.

У меня сейчас реализован сбор данных через ком, на основании местной же разработки, хотел переписывать через вебсервис, но это, походу не нужно ;)
Работает весьма и весьма шустро. не нужно парсить гигабайтные xml выгрузки журналов.
Сейчас тестирую параллельную загрузку журнала 1 базы из 3-х источников - работающая база, 2 файла журнала, которые в один прекрасный момент пришли в негодность. Пока все работает

Использую бинарник 1.1.2.1.zip т.к. журналы в формате sqlight - не заполняется колонка [MetadataID] видимо metadataCodes в базе там ид метаданных через запятую, а для связи используется таблица EventLogMetadata, не смотрел еще, но скорее всего когда в metadataCodes несколько кодов (типа события регистрации ошибок доступа) то в ней на каждую запись события несколько записей кодов метаданных.
сырцов нет, поправить особо возможности тоже, если есть возможность сделать в [MetadataID] первый по счету ИД - было бы здорово.

Со своей стороны выложу обработку для открытия событий по объекту с обращением к базе журнала. т.к. буду использовать сие в своих конфах.
19. Aleksey.Bochkov 3094 19.11.15 20:45 Сейчас в теме
20. nwomib 02.12.15 13:56 Сейчас в теме
Очень большая просьба, там же выкладывать скомпилированные варианты т.к. уже немного запарился компилировать, вечные ошибки.

Будет ли фича очистки за собой логов с настройкой глубины чистки?
21. nwomib 02.12.15 13:57 Сейчас в теме
Имеется в виду, прочёл лог 1ски , прошло 5 дней и почистил лог 1ски.
23. Aleksey.Bochkov 3094 10.06.16 08:26 Сейчас в теме
Попробовал собрать актуальную версию... не уверен, что все правильно сделал, т.к. давно не занимался.
Скачать можно здесь: https://github.com/alekseybochkov/EventLogLoader/releases/tag/1.0.0.2
Если будут проблемы - попробую поправить.
29. zzz_natali 59 26.07.17 16:18 Сейчас в теме
(23) Ваш запрос T-SQL не выводит данные. Формируются заголовки столбцов и всё. Данные в базе есть(ибо если ручками делать select top 1000, то выводит потроха). В чём может быть прикол? Спасибо.
30. JohnyDeath 291 26.07.17 23:07 Сейчас в теме
(29) какой формат лога? Текст?
31. zzz_natali 59 27.07.17 05:29 Сейчас в теме
(30) Формат lgf/lgp. Текст чего, запроса? - взят с публикации.
37. Noxie41 16.11.18 16:53 Сейчас в теме
(29) Проблема во внутреннем соединении в запросе по таблице дополнительного ip порта.
Исправленный запрос ниже:
SELECT TOP (1000) Infobases.Name,
       Events.DateTime,
       Events.TransactionStatus,
       Events.TransactionStartTime,
       Events.TransactionMark,
       Users.Name AS [User],
       Computers.Name AS Computer,
       Applications.Name AS App,
       Events.Field2,
       EventsType.Name AS EventType,
       Events.EventType,
       Events.Comment,
       Metadata.Name AS Metadata,
       Events.DataStructure,
       Events.DataString,
       Servers.Name AS [Server],
       MainPorts.Name AS MainPort,
       SecondPorts.Name AS SecondPort,
       Events.Seance
FROM EVENTS
INNER JOIN Applications ON Events.InfobaseCode = Applications.InfobaseCode
AND Events.AppName = Applications.Code
INNER JOIN Computers ON Events.InfobaseCode = Computers.InfobaseCode
AND Events.ComputerName = Computers.Code
INNER JOIN EventsType ON Events.InfobaseCode = EventsType.InfobaseCode
AND Events.EventID = EventsType.Code
INNER JOIN Infobases ON Events.InfobaseCode = Infobases.Code
INNER JOIN Users ON Events.InfobaseCode = Users.InfobaseCode
AND Events.UserName = Users.Code
LEFT JOIN SecondPorts ON Events.InfobaseCode = SecondPorts.InfobaseCode
AND Events.SecondPortID = SecondPorts.Code
INNER JOIN Servers ON Events.ServerID = Servers.Code
AND Events.InfobaseCode = Servers.InfobaseCode
INNER JOIN MainPorts ON Events.InfobaseCode = MainPorts.InfobaseCode
AND Events.MainPortID = MainPorts.Code
INNER JOIN Metadata ON Events.InfobaseCode = Metadata.InfobaseCode
AND Events.MetadataID = Metadata.Code
Показать
Aleksey.Bochkov; +1 Ответить
24. Oleg1978 19.07.16 12:36 Сейчас в теме
Алексей, добрый день!

Я правильно понимаю, что журнал регистрации 1С отображать на Microsoft SQL Server штатными настройками невозможно (по аналогии со всеми другими таблицами информационной базы)? А Ваша обработка как раз и формирует на SQL необходимые таблицы и загружает в нее данные из файла ? Подскажите, пожалуйста, Ваша обработка может работать с версией Предприятия 1С 8.3.7 и файлом .lgf ? Спасибо!
26. zarucheisky 07.09.16 13:53 Сейчас в теме
(24) Oleg1978, с версией Предприятия 1С 8.3.7 ЖР хранится в формате SQLite - можно поставить ODBC драйвер.
27. alyaev.a.v 08.11.16 13:00 Сейчас в теме
Хорошо бы кто поправил ошибку при загрузке, например такая запись останавливает загрузку и сервис тупо висит:
{20160418154655,N,
{0,0},63,1,4,113934,75,E,"",98,
{"S","{ОбщийМодуль.ОбщегоНазначения.Модуль(6907)}: Не удалось записать ""Документ 0001834 от 07.11.2015 13:45:11""!(ТУТ ПЕРЕВОД НА СЛЕД СТРОКУ)
Для документа договор обязательно должен быть заполнен!!!(ТУТ ПЕРЕВОД НА СЛЕД СТРОКУ)
ВызватьИсключение СокрЛП(КраткоеПредставлениеОшибки(Информация) + Символы.ПС + СокрЛП(ТекстИсключения));"},"",1,8,0,21665,0,
{2,1,1,2,1}
}

если в тексте убрать перевод строки и сделать так(удалить переводы строк в описании сообщения)то все работает :
{20160418154655,N,
{0,0},63,1,4,113934,75,E,"",98,
{"S","{ОбщийМодуль.ОбщегоНазначения.Модуль(6907)}: Не удалось записать ""Документ 0001834 от 07.11.2015 13:45:11""!Для документа договор обязательно должен быть заполнен!!! ВызватьИсключение СокрЛП(КраткоеПредставлениеОшибки(Информация) + Символы.ПС + СокрЛП(ТекстИсключения));"},"",1,8,0,21665,0,
{2,1,1,2,1}
}
Aleksey.Bochkov; +1 Ответить
28. baton_pk 384 11.01.17 13:42 Сейчас в теме
32. SashkaIvanov 06.03.18 13:54 Сейчас в теме
Произошел какой-то сбой, в таблице Events выдаются записи которые не от этой базы, не к тому пользователю. Если сравнивать файловый, и то что в БД, имеется запись с датой и id но пользователь не тот, и событие не то. как будто что-то перепуталось (сервис работает сразу с 3 базами) и чать данных от одной базы, а часть от другой. Если ли возможность как-то исправить данную ошибку. И есть ли возможность например вызвать что-то чтобы удалить записи по последнему лог файлу, и запустить повторный экспорт.(Пойдет ли вариант удаления в params и зачистка всех таблиц от данного кода Infobases?)
33. SashkaIvanov 06.03.18 14:45 Сейчас в теме
Новая версия к старой базе БД не создает колонку в params LastEventID из-за этого запись не создается
34. SashkaIvanov 19.03.18 08:55 Сейчас в теме
Сейчас пытаюсь все таки понять что произошло, произошло что-то с бд. Таблица User заполнена криво, то есть коды пользователей в таблице EVENTS соответствуют кодам USER, но в таблице USER какие-то левые пользователи под этими кодами. Пробовал по ГУИДУ искать пользователей в базе,(Гуид который указан в колонке GUIS , ничего не находит.) откуда тогда они взялись. Сразу скажу в базе Гуиды не поменялись, ну даже если и поменялись, ведь загрузка должна была создать новую строку, чего не произошло. В общем на текущий момент пока что ошибка в том что таблица USER кривая, и не понятно как ее перезаполнить, ведь удалив из таблицы все, и затем запустив загрузчик, User приедут с новыми кодами, и все предыдущие логи будут утерены!
36. alyaev.a.v 21.06.18 13:37 Сейчас в теме
Предыдущий коммент не правильно описал исправить нет возможности, вот так правильно:

1.Если винда где стоит сервер 1с русская и файл в новом формате, в базу с логами попадает не читаемый текст.
2.Если настроено на онлайн чтение лога(база активно работает логи в старом формате, режутся по дням) периодически загрузка логов останавливается, хотя база активно пишет в файл и получается что часть данных до окончания текущего дня теряется, на след день создается новый файл лога, программа считает что старый файл прочитан полностью и начинает чтение нового файла. Выяснить удалось что номер последнего символа который сохранен в файле загрузчика указывает на конец строки, хотя в процессе чтения обычно указывает на начало строки например:



{20180515000000,C,
{2430080b7a000,2cf},101,161,3,235565,1,I,"",0,
{"U"},"",2,10,0,4885,0,
{2,1,1,2,1}
},КОГДА СЛУЧАЕТСЯ ОСТАНОВКА И ЧТЕНИЕ ПРЕКРАЩАЕТСЯ НОМЕР ПОЗИЦИИ УКАЗЫВАЕТ СЮДА
ОБЫЧНО НОМЕР ПОЗИЦИИ УКАЗЫВАЕТ СЮДА И ВСЕ РАБОТАЕТ ХОРОШО{20180515000000,C,
{2430080b7a000,2cf},101,161,3,235565,2,I,"",0,
{"U"},"",2,10,0,4885,0,
{2,1,1,2,1}
},

Если руками в файле поправить позицию, установить на начало строки то чтение возобновляется и файл дочитывается нормально.
Оставьте свое сообщение