Регулярные выражения без COM объектов и внешних компонент

09.02.15

Разработка - Универсальные функции

Платформа до сих пор не поддерживает регулярные выражения, хотя они уже стали довольно востребованной возможностью в разных языках программирования. Использование COM объектов и внешних компонент имеет ограничения, поэтому предлагается вариант реализации ограниченного функционала на встроенном языке 1С.

Скачать файлы

Наименование Файл Версия Размер
Тест регулярных выражений
.epf 7,70Kb
25
.epf 1.0.0.1 7,70Kb 25 Скачать

Данный функционал реализован в конфигурации 1С:Переводчик начиная с версии 2.1.

Бесплатно скачать её можно на сайте 1C:Developer Network.

Подробнее о регулярных выражениях удачнее всего, на мой взгляд, написано в документации PHP.

Хороший отладчик регулярных выражений.

Поддерживаемый синтаксис:

 Модификаторы, должны располагаться в начале шаблона, например (?i):
   i - регистронезависимый поиск.
   Символы шаблона:
    .  - один любой символ. 
    \. - символ точка.
    \s - пробельный символ.
    \d - цифра.
    \n - символ новой строки.
    \r - символ возврата каретки.
    \S - не пробельный символ.
    *  - любое количество символов (должен располагаться после повторяемого символа, 
      например .*), по умолчанию работает в режиме "жадный".
    +  - один или больше символов (должен располагаться после повторяемого символа,
      например .+), по умолчанию работает в режиме "жадный".
    ?  - один или ни одного символа (должен располагаться после повторяемого символа, 
      например .?), по умолчанию работает в режиме "жадный".
    ? после * или + - переключает режим "жадный" в режим "ленивый".
    \A, ^ - начало строки.
    \z, $ - конец строки.
    (, ) - начало и конец группы, например (на|около).
    | - разделитель альтернатив в группе.
    [, ] - начало и конец списка символов, например [abxv\s], [^R].
   ^ - в начале списка символов означает, что список содержит символы, которые не должны
    совпасть со строкой.
    \], \[, \), \(, \}, \{ - открывающие и закрывающие скобки: ], [, ), (, }, {.
    \\, \/ - слеши: \, /.
    \? - знак вопроса.
    \+ - знак плюса.
    \- - знак минуса.
    \* - знак звёздочка.
    \^ - знак циркумфлекс.
    \$ - знак доллара.
    \| - знак вертикальной полосы.

В прилагаемой к статье обработке приводится пример использования этой возможности.

Поиск в заданной строке по регулярному выражению выполняет функция MatchWildcard модуля StringFunctionsExClientServer. Она возвращает массив с найденными вхождениями, каждый элемент массива - это соответствие, содержащее в нулевом элементе полную найденную строку, а цифрами от 1 и далее - найденные в этом вхождении группы (скобки).

Вхождения = StringFunctionsExClientServer.MatchWildcard(ИсходныйТекст, "(?i)<name>(.*?)<\/name>", Истина);

Регулярные выражения RegExp RegEx preg_match match

См. также

GUID в 1С 8.3 - как с ними быть

Универсальные функции Платформа 1С v8.3 Конфигурации 1cv8 Бесплатно (free)

Пришлось помучиться с GUID-ами немного, решил поделиться опытом, мало ли кому пригодится.

12.02.2024    4326    atdonya    22    

41

Переоткрытие внешних обработок

Универсальные функции Платформа 1С v8.3 Бесплатно (free)

На заключительных этапах, когда идет отладка или доработка интерфейса, необходимо много раз переоткрыть внешний объект. Вот один из способов автоматизации этого.

30.11.2023    3884    ke.92@mail.ru    16    

60

Валидация JSON через XDTO (включая массивы)

WEB-интеграция Универсальные функции Механизмы платформы 1С Платформа 1С v8.3 Конфигурации 1cv8 Бесплатно (free)

При работе с интеграциями рано или поздно придется столкнуться с получением JSON файлов. И, конечно же, жизнь заставит проверять файлы перед тем, как записывать данные в БД.

28.08.2023    8561    YA_418728146    6    

139

Печать непроведенных документов для УТ, КА, ERP. Настройка печати по пользователям, документам и печатным формам

Пакетная печать Печатные формы Адаптация типовых решений Универсальные функции Платформа 1С v8.3 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х Россия Абонемент ($m)

Расширение для программ 1С:Управление торговлей, 1С:Комплексная автоматизация, 1С:ERP, которое позволяет распечатывать печатные формы для непроведенных документов. Можно настроить, каким пользователям, какие конкретные формы документов разрешено печатать без проведения документа.

2 стартмани

22.08.2023    2022    21    progmaster    7    

3

Расширение: Быстрые отборы через буфер [Alt+C] Копировать список, [Alt+V] Вставить список, [Ctrl+C] Копировать из файлов

Инструментарий разработчика Универсальные функции Платформа 1С v8.3 Конфигурации 1cv8 1С:Розница 2 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х 1С:Зарплата и Управление Персоналом 3.x Абонемент ($m)

Копирует в буфер значения из списков, из ячеек отчетов, таблиц, настроек списков, других отборов и вставляет в выбранную настройку отбора. Работает с Объект не найден. Работает как в одной так и между разными базами 1С. Использует комбинации [Alt+C] Копировать список, [Alt+V] Вставить список. Также для копирования данных используется стандартная [Ctrl+C] (например из открытого xls, mxl, doc и т.п. файла скопировать список наименований)

1 стартмани

13.10.2022    16015    131    sapervodichka    112    

129

Система контроля ведения учета [БСП]

Универсальные функции Механизмы типовых конфигураций БСП (Библиотека стандартных подсистем) Платформа 1С v8.3 Конфигурации 1cv8 Бесплатно (free)

В данном материале рассмотрим типовой алгоритм подсистемы контроля учета БСП в конфигурациях на примерах.

18.07.2022    7200    quazare    8    

108
Комментарии
В избранное Подписаться на ответы Сортировка: Древо развёрнутое
Свернуть все
1. eugeniezheludkov 43 09.02.15 03:35 Сейчас в теме
блин ну почему я так невнимательно прочитал ? скачал, а ей же еще целую конфу качать нужно, 1С:Переводчик ... :(
user785225; for_sale; ekaruk; +3 Ответить
2. boogie 489 09.02.15 07:59 Сейчас в теме
Она показывает механизм, который в нём заложен.
3. Yashazz 4707 09.02.15 08:35 Сейчас в теме
Без обид, но про использование встроенных в 1С регулярок уже вроде писали... А тут ни подробностей, ничего, типа "иди качай конфу".
4. tormozit 7133 09.02.15 09:20 Сейчас в теме
Слабо раскрыты преимущества и недостатки предлагаемого метода. Я всегда пользовался VBscript.RegExp, как и большинство. Неплохо бы провести сравнение по скорости, синтаксису, объектной модели, кроссплатформенности и т.д. с ним.
kiruha; artbear; Pr-Mex; AllexSoft; +4 Ответить
5. boogie 489 09.02.15 09:40 Сейчас в теме
Преимущество самое главное в том, что регулярные выражения реализованы исключительно на встроенном языке, поэтому не требуется ни внешних компонент, ни COM объектов, ни вызова команд ОС, работает на сервере и на клиенте, под любую ОС и любой тип клиента.
7. tormozit 7133 09.02.15 18:49 Сейчас в теме
(5) очень хотелось бы узнать насколько медленнее оно работает.
pvlunegov; +1 Ответить
6. yukon 143 09.02.15 11:59 Сейчас в теме
Платформа до сих пор не поддерживает регулярные выражения, хотя они уже стали довольно востребованной возможностью в разных языках программирования.

Судя по всему разработчики платформы 1С не включают язык 1С в множество этих "разных языков программирования".

Хотя пример реализации регулярок на встроенном языке это, конечно, отличный пример madskills. На 1c-dn.com есть еще реализация парсера json, и работа с биткоинами на встроенном языке.
43. peper- 16.08.22 19:48 Сейчас в теме
(6) Потребовалось всего 10 или 15 лет мольбы со стороны разработчиков 1С и в платформе 8.3.23 появилась "Поддержка регулярных выражений во встроенном языке". :)
8. boogie 489 09.02.15 19:37 Сейчас в теме
Определённо медленнее. Замеры можете сделать самостоятельно,
9. Yashazz 4707 10.02.15 11:42 Сейчас в теме
На каких объёмах тестировали? Известно, что на достаточно больших объёмах вызов WScriptShell вешает 1С-ку. У вас "верхняя граница" известна?
11. tormozit 7133 10.02.15 13:35 Сейчас в теме
(9) Вешают только кривые выражения поиска. Но ограничение по размеру обрабатываемого текста у COM объекта VBScript.RegExp действительно есть. От чего зависит не понял, но у меня оно колеблется от 20 до 40 МБ. При его срабатывании выдается ошибка 0x8007000E (E_OUTOFMEMORY)(пример тут http://devtool1c.ucoz.ru/forum/2-270-1)
10. boogie 489 10.02.15 11:49 Сейчас в теме
Пока намертво не зависало, при желании можете эти тесты выполнить и поделиться результатом.
12. boogie 489 10.02.15 18:40 Сейчас в теме
Ну, кривые выражения нужно исправлять, это как кривой код в программе.
headMade; +1 Ответить
13. Sirruf 192 12.02.15 13:40 Сейчас в теме
Это же аццки медленно будет работать!
14. boogie 489 13.02.15 08:09 Сейчас в теме
Работает вполне терпимо, время работы зависит сложности выражения и объёма текста, журнал регистрации анализировать регулярным выражением конечно будет долго, это для регулярной работы и не стоит делать - быстрее загнать в БД и делают выборку. А если нужно разово что-то посмотреть или сделать условие проверки поля email, например, вполне. В Переводчике используется обширно для задания условий в словаре, для очистки HTML от лишних тегов, вставляемых Вордом, для поиска заголовков и картинок и др.
15. boogie 489 13.02.15 08:10 Сейчас в теме
Да, в режиме отладки работает на порядок медленнее, без отладки существенно быстрее - потому, что на встроенном языке и есть возможность поставить точку останова в любом месте.
16. for_sale 970 04.03.15 11:13 Сейчас в теме
т.е. использование внешних компонент - это ограничение, а использование целой сторонней конфы - это не ограничение?
17. boogie 489 04.03.15 12:36 Сейчас в теме
Нет конечно - она ж на встроенном языке написана.
18. for_sale 970 04.03.15 13:04 Сейчас в теме
(17) т.е. то, что она платная, что для скачивания даже бесплатной версии нужна регистрация, что нужна интеграция её с типовым решением, если вдруг надо что-то внедрять - это всё мелочи, главное, что она написана на языке 1С? :) отличная логика!
Зеленоград; +1 Ответить
19. boogie 489 04.03.15 13:50 Сейчас в теме
Где сказано, что она платная?
20. boogie 489 04.03.15 13:51 Сейчас в теме
Нужно иметь лицензию на платформу.
21. quick 583 01.04.15 17:13 Сейчас в теме
Хороший пример извращения, к сожалению неизбежного в 1С.
22. oleshko_alexey 2 03.03.16 22:24 Сейчас в теме
Когда уже РегЕкспы в платформу добавят?????
23. starik-2005 3031 03.03.16 22:34 Сейчас в теме
Регулярки на встроенном языке используются для паттернов в XDTO-пакетах. Там есть офсеты. С помощью них можно как раз это легко провернуть.
Полагаю, авторы так и сделали.

(22) Да, включили, через офсеты в XDTO.
26. artbear 1447 04.03.16 19:34 Сейчас в теме
(23) Еще что интересного про ХДТО знаешь? поделись, пожалуйста.
27. starik-2005 3031 04.03.16 21:43 Сейчас в теме
(26) artbear, ну а что там надо знать-то? В моем коде просто создается фабрика на основе загруженной их XML модели, в которой определен тип с фасетом (шаблоном, задаваемым регулярным выражением), а потом при присваивании значения полю с данным типом платформа неявно вызывает проверку. В результате или все хорошо - и возвращаем истину, или все плохо возвращаем ложь. Как выгрузить модель в XDTO написано в статье "XDTO часть 3" - поиск Вам поможет.
24. starik-2005 3031 04.03.16 12:23 Сейчас в теме
(22) retif, можно вот так сделать чисто средствами платформы проверку:

&НаКлиенте
Функция ПроверитьСтроку(Строка, Фасет)
    Чтение = Новый ЧтениеXML;
    Чтение.УстановитьСтроку(
                "<Model xmlns=""http://v8.1c.ru/8.1/xdto"" xmlns:xs=""http://www.w3.org/2001/XMLSchema"" xmlns:xsi=""http://www.w3.org/2001/XMLSchema-instance"" xsi:type=""Model"">
                |<package targetNamespace=""sample-my-package"">
                |<valueType name=""testtypes"" base=""xs:string"">
                |<pattern>" + Фасет + "</pattern>
                |</valueType>
                |<ob jectType name=""TestObj"">
                |<property xmlns:d4p1=""sample-my-package"" name=""TestItem"" type=""d4p1:testtypes""/>
                |</objectType>
                |</package>
                |</Model>");

    Модель = ФабрикаXDTO.ПрочитатьXML(Чтение);
    МояФабрикаXDTO = Новый ФабрикаXDTO(Модель);
    Пакет = МояФабрикаXDTO.Пакеты.Получить("sample-my-package");
    Тест = МояФабрикаXDTO.Создать(Пакет.Получить("TestObj"));

    Попытка
        Тест.TestItem = Строка;
        Возврат Истина
    Исключение
        Возврат Ложь
    КонецПопытки;
    
КонецФункции
    
&НаКлиенте
Процедура Модель(Команда)
    
    Сообщить(ПроверитьСтроку("01.01.2012","\d{2}\.\d{2}\.\d{4}"));
    Сообщить(ПроверитьСтроку("01.01.20121","\d{2}\.\d{2}\.\d{4}"));
    
КонецПроцедуры
Показать
sulfur17; check2; Shmell; for_sale; kuzyara; artbear; +6 Ответить
25. artbear 1447 04.03.16 19:13 Сейчас в теме
(24) Прикольная тема, сработало!
30. pvlunegov 157 23.11.17 14:31 Сейчас в теме
(24) Проверка на соответствие регулярному выражению эта верхушка айсберга.
Главные функции и задачи работы с регулярными выражениями:
1. Получение всех подстрок тестируемой строки, удовлетворяющих регулярной строке
2. Таких подстрок может быть множество, они могут быть вложенными одна в другую, даже иметь хаотическую вложенность в зависимости от сложности текста.

XDTO такие задачи решить не может, для этого такую проверку надо делать в цикле перебором всех возможных подстрок, которых может быть миллионы на пару строчек текста.
31. starik-2005 3031 23.11.17 14:56 Сейчас в теме
(30)
XDTO такие задачи решить не может
Не может - увы и ах...
32. KAV2 156 30.10.18 19:06 Сейчас в теме
(24) Бывает нужна не проверка, а именно результат применения регулярного выражения, причем желательно с группами (в виде массива). В сабжевой функции это сделано. Не подскажете как такое же сделать с помощью фабрики XDTO?
33. starik-2005 3031 31.10.18 13:26 Сейчас в теме
36. tvm 01.10.19 10:10 Сейчас в теме
подскажите а как с помощью (24) можно проверить наличие строке "@ " и "." ?
проверяемая строка например "@yandex.ru". На https://regex101.com/ шаблон вида "[@].+\.+\w" срабатывает норм. А здесь не получается
37. starik-2005 3031 01.10.19 19:49 Сейчас в теме
(36) "\w+@\w+.\w+" - это если мыло, как вариант.
38. tvm 03.10.19 09:17 Сейчас в теме
39. sulfur17 59 15.06.21 12:59 Сейчас в теме
(24)
опечатка в строке
|<ob jectType name=""TestObj"">

должно быть
|<objectType name=""TestObj"">
mrscrimer; +1 Ответить
40. sulfur17 59 15.06.21 13:10 Сейчас в теме
(24)
Чтобы этот способ работал с символом & надо вот так
Чтение.УстановитьСтроку(
                "<Model xmlns=""http://v8.1c.ru/8.1/xdto"" xmlns:xs=""http://www.w3.org/2001/XMLSchema"" xmlns:xsi=""http://www.w3.org/2001/XMLSchema-instance"" xsi:type=""Model"">
                |<package targetNamespace=""sample-my-package"">
                |<valueType name=""testtypes"" base=""xs:string"">
                |<pattern>" + СтрЗаменить(Выражение, "&", "& amp;") + "</pattern>
                |</valueType>
                |<ob jectType name=""TestObj"">
                |<property xmlns:d4p1=""sample-my-package"" name=""TestItem"" type=""d4p1:testtypes""/>
                |</objectType>
                |</package>
                |</Model>");
Показать

"& amp;" и "ob jectType" - без пробела
41. sulfur17 59 15.06.21 13:31 Сейчас в теме
(24) у этого способа какая-то беда с многострочными строками. Не подскажете как с ними работать?
28. morfeus 08.12.16 20:07 Сейчас в теме
В статье написано что методика не использует COM объекты, а в конфигурации "Переводчик" идёт создание COM объекта. Кругом обман
29. morfeus 08.12.16 20:09 Сейчас в теме
Ааа, неправ. Или ComОбъект, или кодом 1с-ным сделали. Сорри )
34. TuneSoft 246 06.05.19 07:48 Сейчас в теме
Неоднозначная статья и комментарии.
В мобильном приложении 1С эта методика будет работать ?
35. boogie 489 18.05.19 23:14 Сейчас в теме
Должно, реализация регулярных выражений на встроенном языке это подразумевает. Но не тестировалось.
42. user785225 17 21.03.22 11:31 Сейчас в теме
Качнул Переводчик 2.1

Function MatchWildcard(String, Pattern, Global = False) Export
...
RegExp = StringFunctionsExCached.GetRegExpComObject();
...
EndFunction

Function GetRegExpComObject() Export
Return New COMObject("VBScript.RegExp");
EndFunction

Закрыл
44. boogie 489 27.10.22 15:05 Сейчас в теме
(43) Смотрите серверную часть - этот ком объект приводит к падению сервера.
Оставьте свое сообщение