Регулярные выражения без COM объектов и внешних компонент

09.02.15

Разработка - Универсальные функции

Платформа до сих пор не поддерживает регулярные выражения, хотя они уже стали довольно востребованной возможностью в разных языках программирования. Использование COM объектов и внешних компонент имеет ограничения, поэтому предлагается вариант реализации ограниченного функционала на встроенном языке 1С.

Скачать файл

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование По подписке [?] Купить один файл
Тест регулярных выражений
.epf 7,70Kb ver:1.0.0.1
25
25 Скачать (1 SM) Купить за 1 850 руб.

Данный функционал реализован в конфигурации 1С:Переводчик начиная с версии 2.1.

Бесплатно скачать её можно на сайте 1C:Developer Network.

Подробнее о регулярных выражениях удачнее всего, на мой взгляд, написано в документации PHP.

Хороший отладчик регулярных выражений.

Поддерживаемый синтаксис:

 Модификаторы, должны располагаться в начале шаблона, например (?i):
   i - регистронезависимый поиск.
   Символы шаблона:
    .  - один любой символ. 
    \. - символ точка.
    \s - пробельный символ.
    \d - цифра.
    \n - символ новой строки.
    \r - символ возврата каретки.
    \S - не пробельный символ.
    *  - любое количество символов (должен располагаться после повторяемого символа, 
      например .*), по умолчанию работает в режиме "жадный".
    +  - один или больше символов (должен располагаться после повторяемого символа,
      например .+), по умолчанию работает в режиме "жадный".
    ?  - один или ни одного символа (должен располагаться после повторяемого символа, 
      например .?), по умолчанию работает в режиме "жадный".
    ? после * или + - переключает режим "жадный" в режим "ленивый".
    \A, ^ - начало строки.
    \z, $ - конец строки.
    (, ) - начало и конец группы, например (на|около).
    | - разделитель альтернатив в группе.
    [, ] - начало и конец списка символов, например [abxv\s], [^R].
   ^ - в начале списка символов означает, что список содержит символы, которые не должны
    совпасть со строкой.
    \], \[, \), \(, \}, \{ - открывающие и закрывающие скобки: ], [, ), (, }, {.
    \\, \/ - слеши: \, /.
    \? - знак вопроса.
    \+ - знак плюса.
    \- - знак минуса.
    \* - знак звёздочка.
    \^ - знак циркумфлекс.
    \$ - знак доллара.
    \| - знак вертикальной полосы.

В прилагаемой к статье обработке приводится пример использования этой возможности.

Поиск в заданной строке по регулярному выражению выполняет функция MatchWildcard модуля StringFunctionsExClientServer. Она возвращает массив с найденными вхождениями, каждый элемент массива - это соответствие, содержащее в нулевом элементе полную найденную строку, а цифрами от 1 и далее - найденные в этом вхождении группы (скобки).

Вхождения = StringFunctionsExClientServer.MatchWildcard(ИсходныйТекст, "(?i)<name>(.*?)<\/name>", Истина);

Регулярные выражения RegExp RegEx preg_match match

См. также

Универсальные функции Программист Платформа 1С v8.3 1C:Бухгалтерия Бесплатно (free)

Благодаря этим пяти строчкам можно больше не заморачиваться с загрузкой из внешних файлов. Пользуюсь везде, всегда и постоянно.

21.05.2024    29614    dimanich70    83    

151

Универсальные функции Программист Платформа 1С v8.3 1C:Бухгалтерия Абонемент ($m)

Задача: вставить картинку из буфера обмена на форму средствами платформы 1С.

1 стартмани

18.03.2024    4885    6    John_d    11    

57

Универсальные функции Программист Стажер Платформа 1С v8.3 1C:Бухгалтерия Бесплатно (free)

Пришлось помучиться с GUID-ами немного, решил поделиться опытом, мало ли кому пригодится.

12.02.2024    32655    atdonya    25    

59

Универсальные функции Программист Платформа 1С v8.3 Бесплатно (free)

На заключительных этапах, когда идет отладка или доработка интерфейса, необходимо много раз переоткрыть внешний объект. Вот один из способов автоматизации этого.

30.11.2023    6472    ke.92@mail.ru    17    

66

WEB-интеграция Универсальные функции Механизмы платформы 1С Программист Платформа 1С v8.3 1C:Бухгалтерия Бесплатно (free)

При работе с интеграциями рано или поздно придется столкнуться с получением JSON файлов. И, конечно же, жизнь заставит проверять файлы перед тем, как записывать данные в БД.

28.08.2023    17876    YA_418728146    8    

171

Пакетная печать Печатные формы Адаптация типовых решений Универсальные функции Платформа 1С v8.3 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х Россия Абонемент ($m)

Расширение для программ 1С:Управление торговлей, 1С:Комплексная автоматизация, 1С:ERP, которое позволяет распечатывать печатные формы для непроведенных документов. Можно настроить, каким пользователям, какие конкретные формы документов разрешено печатать без проведения документа.

2 стартмани

22.08.2023    4751    78    progmaster    11    

4

Инструментарий разработчика Универсальные функции Платформа 1С v8.3 1C:Бухгалтерия 1С:Розница 2 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х 1С:Зарплата и Управление Персоналом 3.x Абонемент ($m)

Копирует в буфер значения из списков, из ячеек отчетов, таблиц, настроек списков, других отборов и вставляет в выбранную настройку отбора. Работает с Объект не найден. Работает как в одной так и между разными базами 1С. Использует комбинации [Alt+C] Копировать список, [Alt+V] Вставить список. Также для копирования данных используется стандартная [Ctrl+C] (например из открытого xls, mxl, doc и т.п. файла скопировать список наименований)

1 стартмани

13.10.2022    19694    188    sapervodichka    112    

137
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. eugeniezheludkov 45 09.02.15 03:35 Сейчас в теме
блин ну почему я так невнимательно прочитал ? скачал, а ей же еще целую конфу качать нужно, 1С:Переводчик ... :(
user785225; for_sale; ekaruk; +3 Ответить
2. boogie 490 09.02.15 07:59 Сейчас в теме
Она показывает механизм, который в нём заложен.
3. Yashazz 4834 09.02.15 08:35 Сейчас в теме
Без обид, но про использование встроенных в 1С регулярок уже вроде писали... А тут ни подробностей, ничего, типа "иди качай конфу".
4. tormozit 7270 09.02.15 09:20 Сейчас в теме
Слабо раскрыты преимущества и недостатки предлагаемого метода. Я всегда пользовался VBscript.RegExp, как и большинство. Неплохо бы провести сравнение по скорости, синтаксису, объектной модели, кроссплатформенности и т.д. с ним.
kiruha; artbear; Pr-Mex; AllexSoft; +4 Ответить
5. boogie 490 09.02.15 09:40 Сейчас в теме
Преимущество самое главное в том, что регулярные выражения реализованы исключительно на встроенном языке, поэтому не требуется ни внешних компонент, ни COM объектов, ни вызова команд ОС, работает на сервере и на клиенте, под любую ОС и любой тип клиента.
7. tormozit 7270 09.02.15 18:49 Сейчас в теме
(5) очень хотелось бы узнать насколько медленнее оно работает.
pvlunegov; +1 Ответить
6. yukon 154 09.02.15 11:59 Сейчас в теме
Платформа до сих пор не поддерживает регулярные выражения, хотя они уже стали довольно востребованной возможностью в разных языках программирования.

Судя по всему разработчики платформы 1С не включают язык 1С в множество этих "разных языков программирования".

Хотя пример реализации регулярок на встроенном языке это, конечно, отличный пример madskills. На 1c-dn.com есть еще реализация парсера json, и работа с биткоинами на встроенном языке.
43. peper- 16.08.22 19:48 Сейчас в теме
(6) Потребовалось всего 10 или 15 лет мольбы со стороны разработчиков 1С и в платформе 8.3.23 появилась "Поддержка регулярных выражений во встроенном языке". :)
8. boogie 490 09.02.15 19:37 Сейчас в теме
Определённо медленнее. Замеры можете сделать самостоятельно,
9. Yashazz 4834 10.02.15 11:42 Сейчас в теме
На каких объёмах тестировали? Известно, что на достаточно больших объёмах вызов WScriptShell вешает 1С-ку. У вас "верхняя граница" известна?
11. tormozit 7270 10.02.15 13:35 Сейчас в теме
(9) Вешают только кривые выражения поиска. Но ограничение по размеру обрабатываемого текста у COM объекта VBScript.RegExp действительно есть. От чего зависит не понял, но у меня оно колеблется от 20 до 40 МБ. При его срабатывании выдается ошибка 0x8007000E (E_OUTOFMEMORY)(пример тут http://devtool1c.ucoz.ru/forum/2-270-1)
10. boogie 490 10.02.15 11:49 Сейчас в теме
Пока намертво не зависало, при желании можете эти тесты выполнить и поделиться результатом.
12. boogie 490 10.02.15 18:40 Сейчас в теме
Ну, кривые выражения нужно исправлять, это как кривой код в программе.
headMade; +1 Ответить
13. Sirruf 195 12.02.15 13:40 Сейчас в теме
Это же аццки медленно будет работать!
14. boogie 490 13.02.15 08:09 Сейчас в теме
Работает вполне терпимо, время работы зависит сложности выражения и объёма текста, журнал регистрации анализировать регулярным выражением конечно будет долго, это для регулярной работы и не стоит делать - быстрее загнать в БД и делают выборку. А если нужно разово что-то посмотреть или сделать условие проверки поля email, например, вполне. В Переводчике используется обширно для задания условий в словаре, для очистки HTML от лишних тегов, вставляемых Вордом, для поиска заголовков и картинок и др.
15. boogie 490 13.02.15 08:10 Сейчас в теме
Да, в режиме отладки работает на порядок медленнее, без отладки существенно быстрее - потому, что на встроенном языке и есть возможность поставить точку останова в любом месте.
16. for_sale 981 04.03.15 11:13 Сейчас в теме
т.е. использование внешних компонент - это ограничение, а использование целой сторонней конфы - это не ограничение?
17. boogie 490 04.03.15 12:36 Сейчас в теме
Нет конечно - она ж на встроенном языке написана.
18. for_sale 981 04.03.15 13:04 Сейчас в теме
(17) т.е. то, что она платная, что для скачивания даже бесплатной версии нужна регистрация, что нужна интеграция её с типовым решением, если вдруг надо что-то внедрять - это всё мелочи, главное, что она написана на языке 1С? :) отличная логика!
Зеленоград; +1 Ответить
19. boogie 490 04.03.15 13:50 Сейчас в теме
Где сказано, что она платная?
20. boogie 490 04.03.15 13:51 Сейчас в теме
Нужно иметь лицензию на платформу.
21. quick 584 01.04.15 17:13 Сейчас в теме
Хороший пример извращения, к сожалению неизбежного в 1С.
22. oleshko_alexey 2 03.03.16 22:24 Сейчас в теме
Когда уже РегЕкспы в платформу добавят?????
23. starik-2005 3167 03.03.16 22:34 Сейчас в теме
Регулярки на встроенном языке используются для паттернов в XDTO-пакетах. Там есть офсеты. С помощью них можно как раз это легко провернуть.
Полагаю, авторы так и сделали.

(22) Да, включили, через офсеты в XDTO.
26. artbear 1568 04.03.16 19:34 Сейчас в теме
(23) Еще что интересного про ХДТО знаешь? поделись, пожалуйста.
27. starik-2005 3167 04.03.16 21:43 Сейчас в теме
(26) artbear, ну а что там надо знать-то? В моем коде просто создается фабрика на основе загруженной их XML модели, в которой определен тип с фасетом (шаблоном, задаваемым регулярным выражением), а потом при присваивании значения полю с данным типом платформа неявно вызывает проверку. В результате или все хорошо - и возвращаем истину, или все плохо возвращаем ложь. Как выгрузить модель в XDTO написано в статье "XDTO часть 3" - поиск Вам поможет.
24. starik-2005 3167 04.03.16 12:23 Сейчас в теме
(22) retif, можно вот так сделать чисто средствами платформы проверку:

&НаКлиенте
Функция ПроверитьСтроку(Строка, Фасет)
    Чтение = Новый ЧтениеXML;
    Чтение.УстановитьСтроку(
                "<Model xmlns=""http://v8.1c.ru/8.1/xdto"" xmlns:xs=""http://www.w3.org/2001/XMLSchema"" xmlns:xsi=""http://www.w3.org/2001/XMLSchema-instance"" xsi:type=""Model"">
                |<package targetNamespace=""sample-my-package"">
                |<valueType name=""testtypes"" base=""xs:string"">
                |<pattern>" + Фасет + "</pattern>
                |</valueType>
                |<ob jectType name=""TestObj"">
                |<property xmlns:d4p1=""sample-my-package"" name=""TestItem"" type=""d4p1:testtypes""/>
                |</objectType>
                |</package>
                |</Model>");

    Модель = ФабрикаXDTO.ПрочитатьXML(Чтение);
    МояФабрикаXDTO = Новый ФабрикаXDTO(Модель);
    Пакет = МояФабрикаXDTO.Пакеты.Получить("sample-my-package");
    Тест = МояФабрикаXDTO.Создать(Пакет.Получить("TestObj"));

    Попытка
        Тест.TestItem = Строка;
        Возврат Истина
    Исключение
        Возврат Ложь
    КонецПопытки;
    
КонецФункции
    
&НаКлиенте
Процедура Модель(Команда)
    
    Сообщить(ПроверитьСтроку("01.01.2012","\d{2}\.\d{2}\.\d{4}"));
    Сообщить(ПроверитьСтроку("01.01.20121","\d{2}\.\d{2}\.\d{4}"));
    
КонецПроцедуры
Показать
sulfur17; check2; Shmell; for_sale; kuzyara; artbear; +6 Ответить
25. artbear 1568 04.03.16 19:13 Сейчас в теме
(24) Прикольная тема, сработало!
30. pvlunegov 160 23.11.17 14:31 Сейчас в теме
(24) Проверка на соответствие регулярному выражению эта верхушка айсберга.
Главные функции и задачи работы с регулярными выражениями:
1. Получение всех подстрок тестируемой строки, удовлетворяющих регулярной строке
2. Таких подстрок может быть множество, они могут быть вложенными одна в другую, даже иметь хаотическую вложенность в зависимости от сложности текста.

XDTO такие задачи решить не может, для этого такую проверку надо делать в цикле перебором всех возможных подстрок, которых может быть миллионы на пару строчек текста.
31. starik-2005 3167 23.11.17 14:56 Сейчас в теме
(30)
XDTO такие задачи решить не может
Не может - увы и ах...
32. KAV2 157 30.10.18 19:06 Сейчас в теме
(24) Бывает нужна не проверка, а именно результат применения регулярного выражения, причем желательно с группами (в виде массива). В сабжевой функции это сделано. Не подскажете как такое же сделать с помощью фабрики XDTO?
33. starik-2005 3167 31.10.18 13:26 Сейчас в теме
36. tvm 01.10.19 10:10 Сейчас в теме
подскажите а как с помощью (24) можно проверить наличие строке "@ " и "." ?
проверяемая строка например "@yandex.ru". На https://regex101.com/ шаблон вида "[@].+\.+\w" срабатывает норм. А здесь не получается
37. starik-2005 3167 01.10.19 19:49 Сейчас в теме
(36) "\w+@\w+.\w+" - это если мыло, как вариант.
38. tvm 03.10.19 09:17 Сейчас в теме
39. sulfur17 66 15.06.21 12:59 Сейчас в теме
(24)
опечатка в строке
|<ob jectType name=""TestObj"">

должно быть
|<objectType name=""TestObj"">
mrscrimer; +1 Ответить
40. sulfur17 66 15.06.21 13:10 Сейчас в теме
(24)
Чтобы этот способ работал с символом & надо вот так
Чтение.УстановитьСтроку(
                "<Model xmlns=""http://v8.1c.ru/8.1/xdto"" xmlns:xs=""http://www.w3.org/2001/XMLSchema"" xmlns:xsi=""http://www.w3.org/2001/XMLSchema-instance"" xsi:type=""Model"">
                |<package targetNamespace=""sample-my-package"">
                |<valueType name=""testtypes"" base=""xs:string"">
                |<pattern>" + СтрЗаменить(Выражение, "&", "& amp;") + "</pattern>
                |</valueType>
                |<ob jectType name=""TestObj"">
                |<property xmlns:d4p1=""sample-my-package"" name=""TestItem"" type=""d4p1:testtypes""/>
                |</objectType>
                |</package>
                |</Model>");
Показать

"& amp;" и "ob jectType" - без пробела
41. sulfur17 66 15.06.21 13:31 Сейчас в теме
(24) у этого способа какая-то беда с многострочными строками. Не подскажете как с ними работать?
28. morfeus 08.12.16 20:07 Сейчас в теме
В статье написано что методика не использует COM объекты, а в конфигурации "Переводчик" идёт создание COM объекта. Кругом обман
29. morfeus 08.12.16 20:09 Сейчас в теме
Ааа, неправ. Или ComОбъект, или кодом 1с-ным сделали. Сорри )
34. TuneSoft 247 06.05.19 07:48 Сейчас в теме
Неоднозначная статья и комментарии.
В мобильном приложении 1С эта методика будет работать ?
35. boogie 490 18.05.19 23:14 Сейчас в теме
Должно, реализация регулярных выражений на встроенном языке это подразумевает. Но не тестировалось.
42. user785225 26 21.03.22 11:31 Сейчас в теме
Качнул Переводчик 2.1

Function MatchWildcard(String, Pattern, Global = False) Export
...
RegExp = StringFunctionsExCached.GetRegExpComObject();
...
EndFunction

Function GetRegExpComObject() Export
Return New COMObject("VBScript.RegExp");
EndFunction

Закрыл
44. boogie 490 27.10.22 15:05 Сейчас в теме
(43) Смотрите серверную часть - этот ком объект приводит к падению сервера.
Оставьте свое сообщение