Внешняя компонента для выполнения регулярных выражений

14.01.22

Разработка - Разработка внешних компонент

Внешняя Native API компонента для выполнения регулярных выражений на платформе 1С:Предприятие 8. Написана на C++. Используется движок PCRE2 версии 10.36 (до версии 13, использовался boost::regex v 1.69). Версия синтаксиса Perl Compatible Regular Expressions.

Скачать файл

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование По подписке [?] Купить один файл
RegEx1CAddin_14.zip
.zip 516,42Kb ver:14
52
52 Скачать (1 SM) Купить за 1 850 руб.
RegExMac64_14.so
.so 426,45Kb ver:14
6
6 Скачать (1 SM) Купить за 1 850 руб.
RegEx1CAddin_Android_14.zip
.zip 316,12Kb ver:14
5
5 Скачать (1 SM) Купить за 1 850 руб.
RegEx1CAddin_Browsers_14.zip
.zip 440,11Kb ver:14
2
2 Скачать (1 SM) Купить за 1 850 руб.

Текущая версия собрана для следующих платформ:
Windows 32bit 

Windows 64bit 

Linux 32bit 

Linux 64bit

MacOS 64bit

Android ARMv7-A

Android x86-64

Google Chrome (Windows)

Тестировалось на платформе 8.3.12.1567 (Windows 7, Windows Server 2008 R2, Ubuntu 14 32-64bit, MacOS Sierra 10.12, Android 8)

Адрес open-source проекта на GitHub: https://github.com/alexkmbk/RegEx1CAddin

Бинарные файлы можно скачать также с GitHub: https://github.com/alexkmbk/RegEx1CAddin/releases

Архив содержит скомпилированный набор компонент, предназначенный для загрузки в общий макет конфигурации.

Сборка осуществлялась с использованием следующих инструментов:

Под Windows: Microsoft Visual Studio Community 2017

Под Linux: GCC 6

Под Mac OS: Clang 9   

Под Android: Android Studio NDK 19.2

Использовалась статическая сборка, поэтому компонента не требует установки каких-либо дополнительных библиотек.

Компонента реализует следующие методы и свойства:

Метод НайтиСовпадения / Matches(<Текст для анализа>, [<Регулярное выражение>], [<ИерархическийОбходРезультатов>])

Метод выполняет поиск в переданном тексте по переданному регулярному выражению.

Результатом выполнения метода будет массив результатов поиска.

Здесь, <ИерархическийОбходРезультатов> - определяет то, как будет осуществлен обход результатов. По умолчанию = Ложь. Если ИерархическийОбходРезультатов=Ложь, тогда каждый элемент массива результатов поиска - найденная подгруппа поиска. Если подгрупп нет, то массив будет содержать один элемент - найденную строку. Если ИерархическийОбходРезультатов=Истина, тогда, каждый элемент массива результатов поиска будет содержать только найденную строку, а значение подгруппы при их наличии, можно будет получить методом ПолучитьПодгруппу.

Возвращаемое значение: Ничего не возвращает.

Для того, чтобы получить результаты выполнения метода (массив результатов), необходимо выполнить метод Следующий/Next(), и после этого, в свойстве ТекущееЗначение/CurrentValue будет доступно значение текущей подгруппы результата выполнения (текущий элемент массива результатов). Идея похожа на обход результата запроса.

Пример:

Рег.НайтиСовпадения("Hello world", "([A-Za-z]+)\s+([a-z]+)");

Пока Рег.Следующий() Цикл
    Сообщить(Рег.ТекущееЗначение);    
КонецЦикла; 

Результат будет содержать 3 элемента:

Hello world
Hello
world

Пример с иерархическим обходом:

Рег.НайтиСовпадения("Hello world", "([A-Za-z]+)\s+([a-z]+)", Истина);

Пока Рег.Следующий() Цикл 

Сообщить(Рег.ТекущееЗначение); // Hello world 
Сообщить(Рег.ПолучитьПодгруппу(0)); // Hello 
Сообщить(Рег.ПолучитьПодгруппу(1)); // world 
КонецЦикла; 

Результат будет содержать 1 элемент и 2 подгруппы, а вывод будте таким же:

Hello world

Hello

world

Метод Количество \ Count()

Возвращает количество результатов поиска, после выполнения метода НайтиСовпадения / Matches

Метод КоличествоВложенныхГрупп() \ SubMatchesCount()

Метод возвращает количество групп (подгрупп\SubMatches) если в шаблоне были заданы группы, например, для шаблона ([A-Za-z]+)\s+([a-z]+) будет возвращено значение 2. Метод возвращает значение только после выполнения метода НайтиСовпадения \ Matches.

Метод ПолучитьПодгруппу \ GetSubMatch(<ИндексПодгруппы>)

Метод возвращает строковое значение подгруппы из результатов поиска методом НайтиСовпадения \ Matches. У метода один параметр - Индекс группы, он задает индекс группы, который следует получить(доступны значения от 0 до КоличествоВложенныхГрупп - 1).

Метод НайтиСовпаденияJSON \ MatchesJSON(<Текст для анализа>, [<Регулярное выражение>])

Метод выполняет поиск в переданном тексте по переданному регулярному выражению.

Результатом выполнения метода будет строка в формате JSON представляющая собой массив структур.

Метод позволяет значительно быстрее получить и обработать результат поиска (за счет минимизации вызовов методов через NativeAPI).

Метод Заменить \ Replace(<Текст для анализа>, [<Регулярное выражение>], <Значение для замены>).

Заменяет в переданном тексте часть, соответствующую регулярному выражению, значением, переданным третьим параметром.

Возвращаемое значение: Строка, результат замены.

Метод Совпадает \ IsMatch \ Test(<Текст для анализа>, [<Регулярное выражение>])

Делает проверку на соответствие текста регулярному выражению.

Возвращаемое значение: Булево. Возвращает значение Истина если текст соответствует регулярному выражению.

Метод Версия \ Version()

Возвращает номер версии компоненты в виде строки.

Возвращаемое значение: Строка

Свойство ВсеСовпадения \ Global

Тип: Булево.

Значение по умолчанию: Ложь.

Если установлено в Истина, то поиск будет выполняться по всем совпадениям, а не только по первому.

 

Свойство Multiline \ Многострочный

Тип: Булево.

Значение по умолчанию: Истина.

Если установлено в Истина, то началом строки считаются также и символы перевода строки.

 

Свойство ИгнорироватьРегистр \ IgnoreCase

Тип: Булево.

Значение по умолчанию: Ложь.

Если установлено в Истина, то поиск будет осуществляться без учета регистра.

Свойство Шаблон \ Pattern

Тип: Строка.

Значение по умолчанию: пустая строка.

Задает регулярное выражение которое будет использоваться при вызове методов компоненты, если в метод не передано значение регулярного выражения.

 

Свойство FirstIndex

Тип: Число.

Аналог свойства FirstIndex из VBScript.RegExp. Возвращает индекс (начинается с 0) первого символа найденного текста в исходной строке.

 

Свойство UCP

Тип: Булево.

Значение по умолчанию: Ложь.

Свойство устанавливает флаг PCRE2_UCP в методе pcre2_compile, что включает обработку всех символов Unicode для директив \W и \w (а не только ASCII).

 

Свойство ОписаниеОшибки \ ErrorDescription

Тип: Строка.

Значение по умолчанию: пустая строка.

Содержит текст последней ошибки. Если ошибки не было, то пустая строка.

Свойство ВызыватьИсключения \ ThrowExceptions

Тип: Булево.

Значение по умолчанию: Ложь.

Если установлена в Истина, то при возникновении ошибки, будет вызываться исключение, при обработке исключения, текст ошибки можно получить из свойства ErrorDescription\ОписаниеОшибки.

Пример использования:

Предполагается что архив с компонентами был загружен в общий макет "RegEx"

УстановитьВнешнююКомпоненту("ОбщийМакет.RegEx");
ПодключитьВнешнююКомпоненту("ОбщийМакет.RegEx", "Component", ТипВнешнейКомпоненты.Native);
            
Рег = Новый("AddIn.Component.RegEx");

Рег.НайтиСовпадения("Hello world", "([A-Za-z]+)\s+([a-z]+)", Истина);

Сообщить(Рег.Количество()); // 1 - всего один результат 
Сообщить(Рег.КоличествоВложенныхГрупп()); // 2 - две подгруппы (submatches)

Пока Рег.Следующий() Цикл 
Сообщить(Рег.ТекущееЗначение); // Hello world 
Сообщить(Рег.ПолучитьПодгруппу(0)); // Hello 
Сообщить(Рег.ПолучитьПодгруппу(1)); // world 
КонецЦикла;

Сообщить(Рег.Совпадает("Hello world", "([A-Za-z]+)\s+([a-z]+)"));
Сообщить(Рег.Заменить("Hello world", "([A-Za-z]+)\s+([a-z]+)", "Текст для замены"));

 

Пример в асинхронном режиме с использованием обещаний (доступно с версии платформы 8.3.18):

&НаКлиенте
Асинх Функция ПодключитьРегулярныеВыражения()
	
	Подключено = Ждать ПодключитьВнешнююКомпонентуАсинх( "ОбщийМакет.RegEx", "Component", ТипВнешнейКомпоненты.Native);
	
	Если НЕ Подключено Тогда 
		
		Ждать УстановитьВнешнююКомпонентуАсинх("ОбщийМакет.RegEx");
		Подключено =  Ждать ПодключитьВнешнююКомпонентуАсинх( "ОбщийМакет.RegEx", "Component", ТипВнешнейКомпоненты.Native);
		
	КонецЕсли;
	
	Возврат Подключено;
	
КонецФункции	

&НаКлиенте
Асинх Процедура Асинхронно(Команда)
	
	Подключено =  Ждать ПодключитьРегулярныеВыражения();
	Если Подключено Тогда
		
		Рег = Новый("AddIn.Component.RegEx"); 
		
		Ждать Рег.УстановитьШаблонАсинх("([A-Za-z]+)\s+([a-z]+)");		
		Ждать Рег.НайтиСовпаденияАсинх("Hello world");
		
		Пока Истина Цикл

			Результат = Ждать Рег.СледующийАсинх();   
			
			Если НЕ Результат.Значение Тогда
				Прервать;        
			КонецЕсли;  
			
			Результат = Ждать Рег.ПолучитьТекущееЗначениеАсинх();
			Сообщить(Результат);    
			
		КонецЦикла; 
	КонецЕсли; 
	
КонецПроцедуры

 

Регулярные выражения RegEx Внешняя компонента

См. также

Разработка внешних компонент Программист Платформа 1С v8.3 Конфигурации 1cv8 Платные (руб)

Внешняя компонента в виде библиотеки (.dll файл), позволяющая посылать команды и получать ответы по протоколу WebSocket из 1С. Компонента работает только на стороне "клиента".

4440 руб.

22.06.2020    18035    18    33    

22

Разработка внешних компонент Программист Платформа 1С v8.3 Конфигурации 1cv8 Платные (руб)

Внешняя компонента позволяет печатать PDF файлы непосредственно из 1С, не используя при этом сторонних программ. Прекрасно работает на сервере, тонком клиенте и веб-клиенте. Основана на проекте PDFium из состава проекта Chromium/Chrome

1500 руб.

17.09.2018    36384    113    127    

114

Разработка внешних компонент Телефония, SIP Программист Платформа 1С v8.3 Конфигурации 1cv8 Россия Платные (руб)

Внешняя компонента выполнена по технологии Native API для 1С 8.х, обеспечивает доступ к программным АТС Asterisk (FreePBX, Elastix) через AMI интерфейс. Через него можно управлять многими функциями Asterisk (определение номеров, перевод звонков, набор телефона и т. д.)

2400 руб.

04.05.2018    46659    121    66    

65

Разработка внешних компонент Программист Платформа 1С v8.3 Платформа 1C v8.2 Платные (руб)

Внешняя компонента, позволяющая посылать команды и получать ответы по GraphQL протоколу из 1С.Может быть использована при интеграции. В 1С работает на стороне "клиента".

4600 руб.

27.06.2023    3329    2    0    

4

Разработка внешних компонент Программист Платформа 1С v8.3 Конфигурации 1cv8 1С:Управление нашей фирмой 1.6 1С:Бухгалтерия 3.0 Платные (руб)

Внешняя компонента позволяет работать c TWAIN-совместимым оборудованием (сканерами, камерами) . Полностью совместима со стандартной TWAIN-компонентой из БСП и может применяться как ее замена без изменения вызовов, при этом может работать с 64-разрядной платформой, а так же имеет расширенную функциональность, например, сохранение результата непосредственно в PDF без использования сторонних утилит. Прекрасно работает на сервере, тонком клиенте и веб-клиенте (проверена работа в браузерах Google Chrome, Mozilla Firefox и Microsoft Internet Explorer).

3000 руб.

12.05.2020    28051    137    100    

89

Разработка внешних компонент Программист Платформа 1С v8.3 Управляемые формы Конфигурации 1cv8 Платные (руб)

Как известно, стремление сделать свою рекламную продукцию запоминающейся и выделяющейся — верный путь к успеху. Сегодня, мы поговорим с вами о том, что можно сделать с обычным черно-белым QR-кодом, чтобы он стал более живым и привлекательным. Если вам не терпится попробовать сгенерировать QR-код с логотипом компании, то эта обработка, представляющая собой генератор qr-кода в режиме онлайн, для вас!

2400 руб.

22.06.2016    31367    5    4    

9

Разработка внешних компонент Механизмы платформы 1С Программист Стажер Платформа 1С v8.3 Бесплатно (free)

Некоторые практические аспекты создания внешних компонент на языке С++ для платформы 1С 8.3++.

26.01.2024    6580    starik-2005    32    

43
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. Dzenn 892 12.11.18 10:45 Сейчас в теме
Буду гадом ;-) На инфостарте есть что-то про регулярные выражения в 1С на основе механизмов работы с XML. То есть, помещаем в поле-HTML нашу строку, обёрнутую в тэги, запускаем встроенную функцию и получаем ответ. Но не уверен, что это аналог, с регулярками особо не приходилось работать.
4. ImHunter 327 12.11.18 12:39 Сейчас в теме
(1) Есть такое, через XDTO делается. Но такой прием работы предназначен только для валидации строки к паттерну.
Т.е. количество и/или место вхождения паттерна - так не найти.
starik-2005; AlX0id; mivari; 🅵🅾️🆇; A_Max; +5 Ответить
6. A_Max 20 12.11.18 12:47 Сейчас в теме
(1) Там ОООООООЧЕНЬ ограниченный функционал.
2. zykov_vitaliy 91 12.11.18 11:36 Сейчас в теме
Использую
Regexp = Новый COMОбъект("VBScript.RegExp");
3. KAV2 157 12.11.18 11:47 Сейчас в теме
(2) Данная компонента работает также под Linux. В планах собрать под MacOS если будут время и силы.
snikov; 7OH; starik-2005; A_Max; +4 Ответить
14. 🅵🅾️🆇 524 12.11.18 17:45 Сейчас в теме
(3) Не думаю, что стоит под огрызок собирать.
Такие компоненты лучше подключать на сервере, вряд ли есть извращенцы хостящиеся на macos (да пусть даже и файловые базы).
41. KAV2 157 19.12.18 18:43 Сейчас в теме
(14) Ну так или иначе, а сборка под Mac OS уже доступна :-)
leoxz; 🅵🅾️🆇; +2 Ответить
5. A_Max 20 12.11.18 12:46 Сейчас в теме
(2) этой штуки нет в linux, а так всё необходимое имеем при себе в базе!
Давно у самого чесались руки самому написать "универсальную" внешнюю компоненту.
7. nixel 1433 12.11.18 15:35 Сейчас в теме
Спасибо огромное!
sashocq; Labotamy; iliabvf; s_vidyakin; +4 2 Ответить
8. Ershov Mikhail 12.11.18 16:13 Сейчас в теме
Идея хорошая, но поясните один момент:
Текст для анализа, препологается передавать в виде параметра внешней компоненты.
например у меня есть лог файл размером 30 Гб. (Txt), правильно ли я понимаю, что перед тем как передать этот текст внешней компоненте, мне необходимо загрузить его в оперативную память ? ... а в чём тогда смысл этой компоненты ? ведь одно из основных преимуществ регэкспа - это поточная обработка текста, вне зависимости от размера файла, т.е "Часть прочитал, часть отпустил"... а тут получается сначала загрузи всё в оперативную память а потом запускай свой конвеер Regex ... как то "не айс", а текстовым файлом в 100 ГБ я также как и без регекспа имею возможность положить сервер по недостатку памяти. Получается "Кайф" от Regexpa потерян ...
... или я неправ ?
9. KAV2 157 12.11.18 16:19 Сейчас в теме
(8) В данном случае можно использовать объект ЧтениеТекста\TextReader. Этот объект может читать не весь файл целиком , а построчно.
Ershov Mikhail; +1 Ответить
10. Ershov Mikhail 12.11.18 16:22 Сейчас в теме
(9) т.е. сначала я построчно его читаю 1С-ом, а потом передаю Regex компоненте ... но ведь тогда скорость обработки будет примерна такаяже как и без Regexa ... узкое место получается чтение 1С ... а может сделать возможность передавать компоненте путь к файлу ?
11. KAV2 157 12.11.18 16:29 Сейчас в теме
(10)Может быть, но пока не готов по этому поводу ответить.
15. 🅵🅾️🆇 524 12.11.18 17:49 Сейчас в теме
(10) Тут надо работу с потоками придумывать или разбирать ваш файл построчно/поблоково.

Вот 2 варианта для работы с текущей компонентой:
1) воспринимаете ваш файл как ТектовыйДокумент с заданым разделителем и читаете "построчно"
2) с помощью СтрНайти последовательно выгрызаете кусочки с заданым отступом

Ну или вы вовсе не правильно воспринимаете задачу, если это некий xml документ, то вам надо, наверное, смотреть в сторону XPath
17. Ershov Mikhail 12.11.18 17:59 Сейчас в теме
(15) Задача гепотетчиеская, из серии "Разобрать файл тех журнала" ... файл может быть большим, 30-50 ГБ.
Почему именно она ? потому что чаще приходится пользоваться Regex'ом именно для её решения.
В Bash - это делается просто, вопрос в том что если есть компонента, которая смогла бы это делать из 1С, минуя Bash - было бы круто и стало бы платформой для тех или иных решений. Но читать текстовый документ построчно и передавать его в ВК с методами Regexa, в рамках этой задачи - скорее всего сильно проиграет Bash'у по скорости и стабильности работы. Как бы исходя из этих мыслей и попросил пояснить возможно ли на текущий момент, используя эту ВК реализовать нечто подобное.
18. 🅵🅾️🆇 524 12.11.18 18:04 Сейчас в теме
(17) Почему проиграет то?
Не думаю, что кто то будет таким заниматься ради весьма необычной задачи.

Если у вас большой файл и его просто надо переварить компонентой, особо не заморачиваясь - делайте регламентной операцией или длительной задачей.
Если надо срочно и в кратчайшие сроки определенный файл "кушать", то и регэксп и 1с тут не годятся, тк проиграет по скорости специально написанной для этого дела утилите с нормальной асинхронностью и заточенный под поиск определенных паттернов.

ЗЫ: парсеров технологических журналов - вагон и маленькая тележка
19. Ershov Mikhail 12.11.18 18:11 Сейчас в теме
(18) Возможно я не совсем правильно понял заголовка статьи ...
Там написано : "Внешняя компонента для выполнения регулярных выражений".
Мои мысли: "Ух ты, круто т.е. нечто типа "grep DEADLOCK */*.log" можно выполнить из 1с ? ... было бы прикольно...
По факту я должен сначала все файлы через оперативку прогнать а потом пользоваться функционалом Regex'a.
+ Читать файл придётся тоже из 1С ... что (как мне кажется), будет медленнее чем выполнение этой же процедуры в Bash.
Хотя технически, ВК, созданная на сервере 1Сб уже имеет все права сервера 1С, вопрос только в описании функционала...
Это не в коем случае не претензия, это всего лишь мнение.
20. 🅵🅾️🆇 524 12.11.18 18:20 Сейчас в теме
(19) Почему быстрее или медленее то? Зачем вам целиком файл пихать в оперативу, вы всегда так делаете?

Вам надо:
0) подключить обработчик ожидания
1) подключить компоненту
2) в цикле читать файл либо построчно, либо в некий буфер
3) скармливать компоненте
4) после завершения цикла отключить компоненту
Опционально делать это в несколько потоков.
Оперативы потратите метр-другой.

Если мы говорим про написание "просмотр файлов в реальном времени", то это задача скорее для реактивной асинхронщины (нужно выводить данные в поток по мере чтения, не забывая выбрасывать из потока информацию находящуюся далеко от указателя пользователя), синхронно переваривать весь файл целиком чтоб показать пользователю кусочек - плохая идея (именно на этом сыпится большинство редакторов и ide, пытающихся синхронно обработать и разметить весь файл до конца).

Если вам не надо отображать пользователю в реальном времени - то парсите по ночам, как бог пошлет и не парьтесь.
MKFreeUser; +1 Ответить
12. azhilichev 214 12.11.18 16:45 Сейчас в теме
(8) Уважаемый, а как вы иначе хотите? Чтобы компонента вам еще и файл читала? Отделяйте мух от котлет.

Автор, если эта компонента работает так, как описал в статье, мысленно жму руку!
13. Ershov Mikhail 12.11.18 16:48 Сейчас в теме
(12) Ну если бы компонента имела возможность читать файл, (А если немного обнаглеть то ещё и маску путей как это работает в Bash) был бы вообще огонь ... но для начала тоже неплохо, ничего против не имею ... это всего лишь идея к развитию проекта ...
Darklight; +1 1 Ответить
26. Dmitryiv 161 14.11.18 10:22 Сейчас в теме
(8) А может не стоит файлы такого размера обрабатывать средствами 1С? Ну совсем не тот инстумент.
27. Ershov Mikhail 14.11.18 15:49 Сейчас в теме
(26) Создатели конфигурации ЦУП и ЦКК из Корпоративного пакета, считают иначе ... Они пошли дальше, не только парсят их в 1С, ещё и хранят их в РС ... в разобранном виде. На продуктивной БД размером в 1 ТБ, и 200 пользователей в онлайне - Операция "Анализ вызовов кластера" по ТЖ весит 250 Гб , при истории данных в полдня ...
В общем то я их 1Сом и не парсю, для этого используется Bash с Regex'ом. Т.к. это компонента как раз про Regex, думал что может тогда без Bash'a сразу из 1С можно пользоваться Regex'ом ... но видимо не сейчас, возможно когда-нибудь прогресс дойдёт и до полномасштабного Regex'а из 1С.
16. Infactum 318 12.11.18 17:56 Сейчас в теме
А зачем внутри компоненты все эти конвертации типов для linux, если под капотом все работает вокруг шаблонов std::basic_regex и std::basic_string, которые позволяют задать базовый тип (в случае компоненты WCHAR_T)?
22. KAV2 157 13.11.18 05:33 Сейчас в теме
(16) Конвертации лишние и их надо будет убрать. Я оставил это на развитие. Кстати, можно добавлять pull request-ы ;-)
starik-2005; +1 Ответить
21. kraynev-navi 681 12.11.18 20:27 Сейчас в теме
(0) Вещь! Не делали сравнений по быстродействию с тем же популярным COMОбъект("VBScript.RegExp") ?
23. KAV2 157 13.11.18 05:42 Сейчас в теме
(21) VBscript быстрее, но там есть ещё пути для оптимизации. Не все оптимально сделано. Принципиально что уже сейчас компонента работает на несколько порядков быстрее чем реализация на 1С в конфигурации 1С:Translator.
kraynev-navi; +1 Ответить
39. KAV2 157 18.12.18 17:31 Сейчас в теме
(21) В компоненте версии 5 теперь не все так однозначно со скоростью. Во первых, если вызывается метод один раз, и в него передать большой текст, то компонента теперь может обходить по скорости VBScript.RegExp, но вот если в цикле часто вызывать методы компоненты, передавая каждый раз небольшой текст для анализа, то VBScript.RegExp быстрее. Связано это с тем, что у платформы 1С высокие накладные расходы на вызов методов Native API внешней компоненты. Даже вызов пустого метода отрабатывает медленнее чем вызов метода COM сервера. Во всяком случае на платформах 8.3.12 и 8.3.13. Похоже что разработчик компоненты на это никак повлиять не может.
24. ayuplotnikov 14.11.18 09:51 Сейчас в теме
Отличная задумка! Успехов вам!
Подскажите, пожалуйста, как управлять флагами i, g, m?
29. KAV2 157 14.11.18 16:41 Сейчас в теме
(24) Честно сказать ни разу не пользовался подобными флагами. Надо будет изучить вопрос.
34. KAV2 157 17.11.18 20:57 Сейчас в теме
(24) В общем, реализация из стандартной библиотеки С++ не поддерживает эти флаги в синтаксисе регулярных выражений. Можно добавить установку этих флагов отдельно, если в них реальная есть потребность, либо за основу взять реализацию не стандартной библиотеки, а скажем boost.
35. ayuplotnikov 18.11.18 09:38 Сейчас в теме
(34) Конкретно для меня критически важен регистронезависимый режим.
Я сейчас в 1С использую VBScript.RegExp. У него эти параметры задаются через булевы свойства Global, IgnoreCase, Multiline. В std::regex - через аргумент конструктора. Существенной разницы между способами я не вижу.
Можно добавить необязательные аргументы к существующим методам или добавить метод, который устанавливает флаги. Все варианты обратно совместимы с текущей реализацией.
38. KAV2 157 18.12.18 17:26 Сейчас в теме
(24) Выложена новая версия компоненты, где кроме всего прочего добавлены свойства Global\ВсеСовпадения и IgnoreCase\ИгнорироватьРегистр.

Также, реализована возможность задавать модификаторы синтаксиса perl, описанные здесь (синтаксис отличается JavaScript) - https://www.regular-expressions.info/modifiers.html
starik-2005; ayuplotnikov; +2 Ответить
25. Darklight 33 14.11.18 10:15 Сейчас в теме
Большое Вам спасибо. Компонента, конечно, замечательная - и я обязательно найду ей применение в своих проектах. А ещё, появление данной публикации, оказалось для меня, как нельзя кстати, я как раз делал свою первую Native компоненты С++ (я совсем не С++ программист) - и уже отчаялся - примеры/шаблоны с ИТС не компилировались, а если заставлял компилироваться - не подключались в 1С. Всё перепробовал. И другие компоненты скачивал - тоже либо не компилировались либо не подключались (на разных платформах и компьютерах и x86 и x64). Думал уже забить на это дело. И тут увидел эту публикацию - и О ЧУДО - она заработала - и на основе шаблона вашей компоненты я сделал свою - и она тоже заработала - АЛИЛУЯ! Но отличия в двух шаблонах так и не нашёл (кроме, разве что не был установлен у меня набор инструментов VS 2017 для XP, использовал набор VS 2013 для XP - но его установка и применение в старом проекте всё-равоно так и не решило проблему), хотя было ещё одно - внешние C++ SDK зависимости (cpp и h) у меня в старом проекте тянулись из каталога SDK версии 7.1, а вашем проекте из SDK версии 8.1 - где и как это настраивается я так и не нашёл (в настройках проекта каталоги в обоих проектах вели именно в SDK версии 7.1). А при применении SDK версии 7.1 с одним из примеров компоненты, скачанной в исходниках из интернета, вообще не компилировался и выдавал ошибку про термы которые "не известны" внутри этого SDK (но мой старый проект, как ни странно, всё-таки компилировался, но компонента не подключалась). В общем, как же это тяжко писать компоненты на VS C++ - спасибо Вам за то, что ваша, вовремя, подоспевшая публикация, помогла мне выбраться из этого тупика! Вот бы ещё разобраться как этот SDK в создаваемых в VS 2017 проектах настроить чтобы знать где же выбирается каталог SDK, откуда должны подтягиваться внешние зависимости (cpp и h).
KAV2; kraynev-navi; +2 Ответить
30. KAV2 157 14.11.18 16:47 Сейчас в теме
(25) Спасибо большое за теплый отзыв! Кстати компонента, собранная на SDK 8 работает и на XP, по крайней мере с SP3 (кажется в одном из сервис паков расширялся формат исполняемых файлов).
120. leasing 5 06.04.22 13:57 Сейчас в теме
(25) В публикации ссылки на шаблон.
28. zakiap 14.11.18 15:58 Сейчас в теме
Похожа на RexV8 только работает медленнее, но зато есть исходники и работа по linux
31. KAV2 157 14.11.18 17:01 Сейчас в теме
(28) Да с производительностью есть куда расти, надеюсь поработать над этим в следующих версиях компоненты.
32. Darklight 33 15.11.18 11:03 Сейчас в теме
(28)
(31) Там в осуждении писали про нестабильную работу RexV8. Проверьте у себя регулярки из поста 62 и ещё нескольких более ранних постов от tormozit.
33. KAV2 157 16.11.18 22:44 Сейчас в теме
(32) Ну на указанных сценариях компонента не падает.
49. Trener 08.05.19 15:36 Сейчас в теме
(28)да, я тоже сразу подумал о RExV8 ,реально очень похоже. Вот только медленно все просто ужас(
50. KAV2 157 08.05.19 15:58 Сейчас в теме
(49) Относительно низкая скорость работы объясняется высокими накладными расходами на вызов методов внешней компоненты, это особенность работы текущих версий платформы. Если передавать большой объем данных за один вызов, тогда скорость работы должна быть на уровне, по крайнее мере точно быстрее чем VBScript.RegExp.
Данная компонента работает на несколько порядков быстрее реализации движка на языке 1С, и при этом доступна почти на всех платформах, включая Mac OS и Android.
36. KAV2 157 18.11.18 17:40 Сейчас в теме
Добавлена в список загрузок отдельным файлом, внешняя компонента, собранная для Mac OS ( тестировалась и собиралась на версии Sierra 10.12).
К сожалению загрузка компоненты из макета не работает (пока не разобрался в чем дело), поэтому компонента и выложена отдельно, без включения в общий архив, предназначенный для загрузки в макет.
Подключить компоненту можно с помощью метода ПодключитьВнешнююКомпоненту:

ПодключитьВнешнююКомпоненту("<Путь к файлу компоненты>/RegExMac64_4.so", "Component", ТипВнешнейКомпоненты.Native)
37. KAV2 157 18.12.18 17:18 Сейчас в теме
Новая версия компоненты - 5

Изменения в версии:
- переезд на boost::regex (за счет этого повышена стабильность работы)
- добавлено свойство Global\ВсеСовпадения
- добавлено свойство IgnoreCase\ИгнорироватьРегистр
- добавлено свойство Template\Шаблон
- добавлено свойство ErrorDescription\ОписаниеОшибки
- добавлено свойство ThrowExceptions\ВызыватьИсключения
- добавлена обработка исключений
- добавлен метод Version\Версия
- оптимизирована производительность
- потеряна совместимость с WindowsXP
starik-2005; +1 Ответить
40. karpik666 3844 19.12.18 16:39 Сейчас в теме
Молодец, этого действительно не хватало, в своей разработке для работы в linux использовал обработку регулярок чисто кодом 1С, штука крутая, но скрость просто убивала.
42. KAV2 157 24.12.18 13:56 Сейчас в теме
Новая версия компоненты - 6

Изменения в версии:
- Добавлена поддержка наименований методов и свойств без учета рЕгИсТрА.
- Исправлена ошибка задвоения результатов, если установлен флаг Global под Linux или Mac OS.
- Исправлена утечка памяти под Linux или Mac OS.
43. KAV2 157 13.02.19 20:13 Сейчас в теме
Новая версия компоненты - 7

Изменения в версии:
- Исправлена утечка памяти при работе под Linux и MacOS
- Удалена зависимость (статическая, при линковке) от библиотеки iconv при работе под Linux и MacOS
- Удален лишний программный код и выполнена небольшая оптимизация.
- Уменьшен размер файла компоненты для MacOS
44. KAV2 157 14.02.19 17:08 Сейчас в теме
Новая версия компоненты - 8

Изменения в версии:
- Исправлены ошибки
- Оптимизация
45. KAV2 157 22.04.19 19:50 Сейчас в теме
Новая версия компоненты - 9

Изменения в версии:
- Исправлены ошибки
- Оптимизация
- Уменьшен размер файлов компоненты
46. KAV2 157 27.04.19 14:26 Сейчас в теме
Добавлен отдельным файлом тестовый архив внешних компонент для Android.
47. KAV2 157 05.05.19 19:15 Сейчас в теме
Добавлена отдельным файлом сборка для 64-битной версии Google Chrome под Linux
48. KAV2 157 06.05.19 12:39 Сейчас в теме
Добавлена сборка для Google Chrome под Windows.
51. GorDAn 29.05.19 23:25 Сейчас в теме
Компонента при обходе результата (ВсеСовпадения = Истина) пропускает пустые подгруппы. Из за этого непонятно, когда заканчивается одно совпадение и начинается другое. Можно настроить, чтобы выводились все группы?
52. KAV2 157 14.06.19 08:21 Сейчас в теме
(51) Нет, настроить требуемое поведение в текущей версии нельзя. Если можно, скинье пожалуйста пример шаблона и пример данных к которым этот шаблон применяется.
53. huxuxuya 375 25.07.19 13:16 Сейчас в теме
А в возвращаемом значении вы могли бы возвращать еще SubMatches?
54. KAV2 157 25.07.19 13:20 Сейчас в теме
(53) все найденные группы, включая вложенные возвращаются последовательно.
55. huxuxuya 375 25.07.19 14:41 Сейчас в теме
(54)не очень понимаю как этой последовательностью пользоваться... например

"яблоко красное и тыква черная и еще одно яблоко фиолетовое и еще одно яблоко белое"
яблоко[\s](\S+)


ожидаю что будет 3 найденных:
яблоко красное
яблоко фиолетовое
яблоко белое

и в каждом вхождении был бы цвет в SubMatches, но если он последовательно выводит то как предполагается использовать группировки?
В шаблоне искать сколько открытых и закрытых скобочек и после первого вывода отсчитывать их количество, что бы понять когда закончилась группа и началась строка поиска?
56. KAV2 157 25.07.19 18:06 Сейчас в теме
(55) Этот момент оставил на развитие. Если предложите вариант и удасться его реализовать то постараюсь оперативно тестовую сборку отправить. Ну и опять же это опенсорс, так что всегда можно доработать под свои нужды.
Более детально можно обсудить в личных сообщениях (или в gitter).

Как вариант:
Добавить пустой результат между группами, то есть:
яблоко красное
красное
(пустая строка в результате)
яблоко фиолетовое
фиолетовое
(пустая строка в результате)
яблоко белое
белое
(пустая строка в результате)
59. cprit 899 29.02.20 12:37 Сейчас в теме
(56) Предлагаю два варианта.
Второй на мой взгляд проще в использовании.

Первый вариант. Реализовать метод Выбрать(), который будет производить выборку в текущей группе. И обходить группу уже существующим методов следующий(). На 1С код по обходу примерно следующий будет

Рег.НайтиСовпадения("Hello world", "([A-Za-z]+)\s+([a-z]+)");

//Обходим MatchCollection
Пока Рег.Следующий() Цикл
ТекстMatch=Рег.ТекущееЗначение;

 //Обходим SubMatches
Рег.Выбрать();
Пока Рег.Следующий() Цикл
 ТекстSubMatch=Рег.ТекущееЗначение;
КонецЦикла;

КонецЦикла;
Показать


Второй вариант. Реализуем еще один метод СледующийПодчиненный(), Который будет обходить коллекцию SubMatches. Код в 1С по обходу примерно следующий

Рег.НайтиСовпадения("Hello world", "([A-Za-z]+)\s+([a-z]+)");

//Обходим MatchCollection
Пока Рег.Следующий() Цикл
ТекстMatch=Рег.ТекущееЗначение;

 //Обходим SubMatches
Пока Рег.СледующийПодчиненный() Цикл
 ТекстSubMatch=Рег.ТекущееЗначение;
КонецЦикла;

КонецЦикла;
Показать
60. KAV2 157 29.04.20 21:03 Сейчас в теме
(55)

Выложена тестовая сборка версии 11, где опционально добавлен новый метод обхода результата поиска. Подробнее - в описании изменений к новой версии.
61. etorpov 06.05.20 14:24 Сейчас в теме
(60)на пару недель пораньше б) благодаря 11 версии сократил костыльный код в 2 раза)
в 11 и 10 версии(в других не проверял) не работает свойство "ИгнорироватьРегистр" - всегда пишет "ошибка чтения значения" приходится переписывать немного строку шаблона
А так все ок, вроде:)
62. KAV2 157 06.05.20 15:37 Сейчас в теме
(61) Спасибо большое за фидбэк!

Ошибка с ИгнорироватьРегистр у меня не воспроизводиться.
Может быть в личных сообщениях спишемся и попробуем устранить проблему?
57. aleks_p99 16.09.19 20:53 Сейчас в теме
Полезный компонент.
Спасибо)
58. 5H1 27.02.20 07:11 Сейчас в теме
Здравствуйте. Как убрать сообщение "Внешняя компонента успешно установлена"?
65. KAV2 157 17.04.21 15:10 Сейчас в теме
(58)
Попробуйте такой код:
Если Не	ПодключитьВнешнююКомпоненту("ОбщийМакет.RegEx", "Component", ТипВнешнейКомпоненты.Native) Тогда
	УстановитьВнешнююКомпоненту("ОбщийМакет.RegEx");
	ПодключитьВнешнююКомпоненту("ОбщийМакет.RegEx", "Component", ТипВнешнейКомпоненты.Native);
КонецЕсли;
63. KAV2 157 31.12.20 17:23 Сейчас в теме
Новая версия компоненты - 11
Изменения в версии:

- Добавлен метод КоличествоВложенныхГрупп\SubMatchesCount

Метод возвращает количество групп (подгрупп\SubMatches) если в шаблоне были заданы группы, например, для шаблона ([A-Za-z]+)\s+([a-z]+) будет возвращено значение 2. Метод возвращает значение только после выполнения метода НайтиСовпадения \ Matches.

- Добавлен метод ПолучитьПодгруппу \ GetSubMatch (<ИндексПодгруппы>)

Метод возвращает строковое значение подгруппы из результатов поиска методом НайтиСовпадения \ Matches. У метода один параметр - Индекс группы, он задает индекс группы, который следует получить(доступны значения от 0 до КоличествоВложенныхГрупп - 1).

- У метода НайтиСовпадения \ Matches добавлен третий, необязательный параметр типа булево, включающий\отключающий иерархический обход результатов поиска.
Полный пример иерархического обхода:

Рег.НайтиСовпадения("Hello world", "([A-Za-z]+)\s+([a-z]+)", Истина); // Истина -  иерархический обход

Сообщить( Рег.Количество()); // 1 - всего один результат, а не 3 
Сообщить( Рег.КоличествоВложенныхГрупп()); // 2 - две подгруппы (submatches)

//Обходим MatchCollection
Пока Рег.Следующий() Цикл
Сообщить(Рег.ТекущееЗначение); // Hello world
Сообщить(Рег.ПолучитьПодгруппу(0)); // Hello
Сообщить(Рег.ПолучитьПодгруппу(1)); // world
КонецЦикла;
Показать

- Исправлено: на некоторых сборках Android не работали вызовы методов на кириллице

- Исправлен ряд ошибок и выполнена оптимизация.
64. KAV2 157 03.01.21 09:49 Сейчас в теме
Новая версия компоненты - 12
Изменения в версии:
- Исправлены ошибки.
66. unichkin 1579 25.04.21 14:36 Сейчас в теме
Добрый день. А где это можно проверять? Сейчас попробовал вместо com-объекта, разница по результатам поиска разительная. И не могу понять в чем проблема. И на сайте где я обычно отлаживаю регулярки https://regex101.com/ - ни в одной из сред исполнения данный результат не повторился.
67. KAV2 157 25.04.21 15:36 Сейчас в теме
(66) Ну во первых отличие может быть в дефолтных флагах. На regex101.com по дефолту включен флаг global (/g) - поиск всех вхождений, на компоненте по дефолту он выключен (устанавливается отдельным свойством см. описание) и выполняется поиск только первого вхождения.

Во вторых, если есть в шаблоне группы, то получение результата может отличаться, в зависимости от флага ИерархическийОбходРезультатов в функции НайтиСовпадения (см. описание выше). То есть результат будет зависеть от того, как осущетвляется обход.

В третьих, может отличаться и ситаксис используемого движка, на самом regex101.com доступно в данный момент 6 различных диалектов и они отрабатывают по разному. В текущей версии компоненты, используется библиотека boost::regex с perl совместимым синтаксисом, но даже несмотря на то, что разработчики этой библиотеки заявляют о совместимости с perl, все равно могут быть какие-то небольшие отличия с другими подобными реализациями.

На данный момент, в разработке переход на другой движок - PCRE2. И уже доступна тестовая сборка компоненты под Linux и Windows - https://github.com/alexkmbk/RegEx1CAddin/releases/tag/13.0
И по предварительным результатам можно сказать, что уже известные расхождения в реализации синтаксиса на этом движке отсутствуют (что не удивительно, ведь судя по всему на regex101.com используется таже библиотека).

Если у вас есть желание,можете написать мне в личку исходные данные для проверки (текст шаблона и текст в котором осуществляется поиск) может быть я смогу подсказать в чем проблема.
68. unichkin 1579 26.04.21 10:36 Сейчас в теме
(67)
Если у вас есть желание,можете написать мне в личку исходные данные для проверки (текст шаблона и текст в котором осуществляется поиск) может быть я смогу подсказать в чем проблема.

Добрый день, спасибо за ответ. Свою проблему уже решил ручным парсингом, воспроизводить нет смысла.
69. KAV2 157 23.05.21 17:45 Сейчас в теме
Новая версия компоненты - 13

Изменения в версии:

- Осуществлен переход на библиотеку PCRE2 версии 10.36, вместо boost::regex. За счет этого, улучшена совместимость с Perl синтаксисом регулярных выражений, а также во многих сценариях существенно улучшена производительность;

- Добавлен метод MatchesJSON\НайтиСовпаденияJSON(<Текст для анализа>, [<Регулярное выражение>]) - возвращает результат в виде JSON текста. Метод позволяет значительно быстрее получить и обработать результат поиска (за счет минимизации вызовов методов через NativeAPI);

- Добавлено свойство FirstIndex - аналог свойства FirstIndex из VBScript.RegExp;

- Добавлено свойство Multiline\Многострочный (По умолчанию = Истина, на движке boost::regex режим Multiline был по умолчанию и его нельзя было отключить);

- Добавлен синоним Test для метода IsMatch.

ВНИМАНИЕ! При переходе с версии 12, рекомендуется проверить работу ваших текущих регулярных выражений на предмет совместимости с новой версией. Поскольку в версии 13 используется новый движок, могут быть расхождения в результатах работы регулярных выражений, поскольку работа boost:regex и PCRE2 не идентична.
70. tormozit 7225 23.05.21 18:08 Сейчас в теме
Эта компонента (версия 13) протестирована и используется в подсистеме "Инструменты разработчика" https://www.hostedredmine.com/issues/889592 в ОС Linux и при выполнении кода на сервере.
svbel85; sashocq; KAV2; +3 Ответить
71. Dzenn 892 05.06.21 01:15 Сейчас в теме
Всё впечатление от компоненты испортили модальные окна и синхронные вызовы (((
72. KAV2 157 05.06.21 13:01 Сейчас в теме
(71) Так используйте асинхронные вызовы, любая внешняя компонента может быть подключена и использована в асинхронном режиме. Можете воспользоваться готовой подсистемой для этого (правда там на текущий момент не самая актуальная версия компоненты) - https://github.com/cpr1c/RegEx1C_cfe/
73. Dzenn 892 05.06.21 13:02 Сейчас в теме
(72) хмм... попробую, спасибо. Но что делать с модальным окном "Компонента подключена" при подключении?
74. KAV2 157 05.06.21 13:04 Сейчас в теме
(73) Используйте асинхронные методы для установки и подключения: НачатьУстановкуВнешнейКомпоненты, НачатьПодключениеВнешнейКомпоненты.
75. Dzenn 892 05.06.21 13:05 Сейчас в теме
(74) хорошо, попробую, спасибо!
76. Dzenn 892 05.06.21 13:09 Сейчас в теме
(74) Установил успешно, подключил успешно, но НайтиСовпадения всё равно исполняется синхронно, и это я уже не пофиксю, видимо (
77. KAV2 157 05.06.21 13:18 Сейчас в теме
(76) Используйте перед каждым названием метода приставку НачатьВызов<ИмяМетода>, например, НачатьВызовНайтиСовпадения, перед получением свойства НачатьПолучение<ИмяСвойства>, перед установкой свойства НачатьУстановку<ИмяСвойства>.
Но надо понимать что в этом случае, первым параметром должен передаваться объект ОписаниеОповещения.

Поскольку это стандартный функционал платформы и работает одинаково для всех внешних компонент, то этот момент в документации не описан.
jake_qwert; +1 Ответить
78. Dzenn 892 05.06.21 13:20 Сейчас в теме
(77) Спасибо огромное за просвещение! Попробую!
79. Dzenn 892 05.06.21 13:29 Сейчас в теме
(77) Попробовал, как ни крути, а без синхронных вызовов сложновато получается — под каждый вызов функции компоненты, будь то НайтиСовпадения(), Количество(), ТекущееЗначение() нужно писать отдельную процедуру под оповещение
80. KAV2 157 05.06.21 13:38 Сейчас в теме
(79) А попробуйте метод НачатьВызовНайтиСовпаденияJSON, он возвращает в качестве результата строку в формате JSON, которую легко можно распарсить следующим образом:
jsonreader = new JSONReader;
jsonreader.SetString(Результат);
res = ReadJSON(jsonreader, False); 
For Each Item In res Do
	Message(Item.Value); 	// тут Item содержит все свойства + массив подгрупп
EndDo; 


С таким подходом асинхронных вызовов будем меньше, при этом скорость работы даже выше, поскольку вызов методов через NativeAPI довольно медленный.

Правда ReadJSON не доступен на вебклиенте, только на тонком.
jake_qwert; +1 Ответить
81. Dzenn 892 05.06.21 13:40 Сейчас в теме
(80) да, отлично, спасибо за наводку!
119. KAV2 157 19.01.22 08:16 Сейчас в теме
(77) Кстати, начиная с версии платформы 8.3.18 доступен механизм асинхронности с помощью обещаний, что сильно упрощает асинхронные вызовы, см. пример в описании выше.
jake_qwert; +1 Ответить
82. Andreynikus 1377 30.07.21 10:17 Сейчас в теме
При подключении на сервере возникает ошибка "Тип не определен (AddIn.Component.RegEx)"
83. KAV2 157 30.07.21 16:59 Сейчас в теме
(82) А метод ПодключитьВнешнююКомпоненту возвращает Ложь? Если так, то рекомендую проверить какой именно комплект компонент используете для сервера, для сервера под Windows и Линукс необходимо использовать комплект RegEx1CAddin_13.zip.
84. Andreynikus 1377 13.08.21 18:13 Сейчас в теме
(83) да именно он и используется, т.к. у всех остальных клиентов работает кроме одного. Сейчас уже проверить нет возможности, заменил компоненту на VBшную через COM, она хоть и медленнее но стабильнее.
85. QbeeQ 16 02.09.21 22:56 Сейчас в теме
Как заставить компоненту действительно игнорировать регистр?
Прикрепленные файлы:
86. tormozit 7225 02.09.21 23:02 Сейчас в теме
(85) Какая платформа (Win/Linux)? У меня на Windows работает эта опция. Правда я устанавливаю ее через латинский вариант - IgnoreCase
87. QbeeQ 16 02.09.21 23:04 Сейчас в теме
Windows 10 Pro x64 Версия 21H1
1С:Предприятие 8.3 (8.3.18.1289) x86
88. QbeeQ 16 02.09.21 23:05 Сейчас в теме
Увы, смена языка не помогает.
Может быть имеет значение то, что шаблон поиска я задаю через свойство, а не при вызове метода "НайтиСовпадения"?
90. QbeeQ 16 03.09.21 00:11 Сейчас в теме
(88) Нашёл причину!
Оказывается имеет значение в каком порядке устанавливаются значения свойств объекта.
Шаблон поиска нужно задавать после установки флагов поиска
И такая конструкция в результат вернёт Ложь

	Ищейка = Новый("AddIn.Component.RegEx");
	Ищейка.Pattern = "слово";
	Ищейка.Global = Истина;
	Ищейка.Multiline = Ложь;
	Ищейка.IgnoreCase = Истина;
	
	Результат = Ищейка.Test("Слово");
91. tormozit 7225 03.09.21 06:42 Сейчас в теме
(90) создай заявку тут https://github.com/alexkmbk/RegEx1CAddin/issues