Регулярные выражения на 1С

11.03.24

Разработка - Математика и алгоритмы

Что ж... лучше поздно, чем никогда. Подсистема 1С для работы с регулярными выражениями: разбор выражения, проверка на соответствие шаблону, поиск вхождений в тексте.

Файлы

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование Скачано Купить файл
Регулярные выражения:
.cf 14,78Kb ver:1.0.0
6 1 850 руб. Купить
Регулярные выражения (расширение):
.cfe 13,69Kb ver:1.0.0
5 1 850 руб. Купить

Подписка PRO — скачивайте любые файлы со скидкой до 85% из Базы знаний

Оформите подписку на компанию для решения рабочих задач

Оформить подписку и скачать решение со скидкой

Подсистема 1С для работы с регулярными выражениями

 

Вдохновившись материалами книг по алгоритмам и структурам данных, я сделал подсистему работы с регулярными выражениями для 1С. Доступный функционал:

  • Построение процессора регулярного выражения по шаблону
  • Проверка полного соответствия текста регулярному выражению
  • Поиск вхождений в тексте по регулярному выражению

 

Реализованы следующие элементы построения регулярных выражений:

  • Операции: |()
  • Квантификаторы: *+?{n}{, n}{n, }{n, m}
  • Символы: .\\t\n\r\f\a\e\xhh\uhhhh
  • Классы символов: [abc][^x-z]
  • Предопределённые классы символов: \d\D\h\H\s\S\v\V\w\W

 

Подсистема обходится исключительно средствами платформы 1С. Отрабатывает на клиенте и сервере (методы глобального контекста в 8.3.23 доступны только на сервере).

В основе движка подсистемы недетерминированный конечный автомат. PDF презентации по материалам книги Роберта Сэджвика и Кевина Уэйна.

 

Разрабатывается на платформах 8.3.21.1302 и 8.3.10.2667

Требуемая минимальная версия: 8.3.6 

Требуемая минимальная версия расширения: 8.3.9

 

Ограничения платформы можно существенно снизить, избавившись от типов Фиксированных коллекций и функции СтрСоединить. Вплоть до 8.1.

 

Пример кода

 

Проверка соответствия всей строки шаблону (процессор можно переиспользовать):

Шаблон = "(A*B|\d)D";
Процессор = Регулярка.ПроцессорРаспознавания(Шаблон);

Сообщить(Регулярка.Распознано(Процессор, "D")); // Ложь
Сообщить(Регулярка.Распознано(Процессор, "3D")); // Истина
Сообщить(Регулярка.Распознано(Процессор, "BD")); // Истина
Сообщить(Регулярка.Распознано(Процессор, "AD")); // Ложь
Сообщить(Регулярка.Распознано(Процессор, "AAAAAABD")); // Истина

 

Поиск вхождений в тексте:

Процессор = Регулярка.ПроцессорРаспознавания("\n");

Текст =
    "Белеет парус одинокой
    |В тумане моря голубом. —
    |Что ищет он в стране далекой?
    |Что кинул он в краю родном?";

Вхождения = Регулярка.Вхождения(Процессор, Текст);

 

PS

 

Репозитарий на github

Надеюсь, будет хватать времени на развитие проекта. Буду благодарен помощи заинтересованных.

Бесплатно Регулярку скачать можно тут. А если хотите выразить благодарность в виде SM – с радостью буду за них приобретать на Инфостарте разработки коллег.

Вступайте в нашу телеграмм-группу Инфостарт

regexp регулярные выражения регулярки конфигурация подсистема поиск модуль библиотека конечный автомат текст нка

См. также

Инструментарий разработчика Роли и права Запросы СКД Программист Руководитель проекта 1С v8.3 Управляемые формы Запросы Система компоновки данных Платные (руб)

Инструменты для разработчиков 1С 8.3: Infostart Toolkit. Автоматизация и ускорение разработки на управляемых формах. Легкость работы с 1С.

15500 руб.

02.09.2020    214389    1180    413    

1050

Инструментарий разработчика Чистка данных Свертка базы Инструменты администратора БД Системный администратор Программист Руководитель проекта 1С v8.3 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 Россия Платные (руб)

Инструмент представляет собой обработку для проведения свёртки или обрезки баз данных. Работает на ЛЮБЫХ конфигурациях (УТ, БП, ERP, УНФ, КА и т.д.). Поддерживаются серверные и файловые базы, управляемые и обычные формы. Может выполнять свертку одновременно в несколько потоков. А так же автоматически, без непосредственного участия пользователя. Решение в Реестре отечественного ПО

8400 руб.

20.08.2024    41245    228    117    

213

Пакетная печать Печатные формы Инструментарий разработчика Программист 1С v8.3 Запросы 1С:Зарплата и кадры бюджетного учреждения 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 Платные (руб)

Расширение для создания и редактирования печатных форм в системе 1С:Предприятие 8.3. Благодаря конструктору можно значительно снизить затраты времени на разработку печатных форм, повысить качество и прозрачность разработки, а также навести порядок в многообразии корпоративных печатных форм.

22200 руб.

06.10.2023    26898    69    30    

98

Инструменты администратора БД Инструментарий разработчика Роли и права Программист 1С v8.3 1C:Бухгалтерия Россия Платные (руб)

Расширение позволяет без изменения кода конфигурации выполнять проверки при вводе данных, скрывать от пользователя недоступные ему данные, выполнять код в обработчиках. Не изменяет данные конфигурации, легко устанавливается практически на любую конфигурацию на управляемых формах.

16000 руб.

10.11.2023    19024    76    39    

92

Инструментарий разработчика Программист 1С v8.3 Платные (руб)

Инструмент для написания и отладки кода в режиме «1С:Предприятие». Представляет собой консоль кода с возможностью пошаговой отладки, просмотра значений переменных любых типов, использования процедур и функций, просмотра стека вызовов, вычисления произвольных выражений на встроенном языке в контексте точки останова, синтаксического контроля и остановки по ошибке. В консоли используется удобный редактор кода с подсветкой, контекстной подсказкой, возможностью вызова конструкторов запроса и форматной строки.

9500 руб.

17.05.2024    38111    135    55    

177

Инструментарий разработчика Нейросети Платные (руб)

Первые попытки разработки на 1С с использованием больших языковых моделей (LLM) могут разочаровать. LLMки сильно галлюцинируют, потому что не знают устройства конфигураций 1С, не знают нюансов синтаксиса. Но если дать им подсказки с помощью MCP, то результат получается кардинально лучше. Далее в публикации: MCP для поиска по метаданым 1С, справке синтакс-помошника и проверки синтаксиса.

9900 руб.

25.08.2025    4745    8    10    

16

Инструментарий разработчика 1С v8.3 1C:Бухгалтерия 1С:ERP Управление предприятием 2 Платные (руб)

Разработка Конструктор автоматизированных рабочих мест "Конструктор АРМ" реализована в виде расширения и является универсальным инструментом для создания АРМ любой сложности в пользовательском режиме.

5000 руб.

27.12.2024    3791    7    0    

12
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. SerVer1C 987 09.06.23 11:01 Сейчас в теме
Да, припоздали вы. С 23-й платформы регулярки уже нативно встроены в язык. Насколько ваш вариант на 1с быстро работает по сравнению с VBScript.RegExp ?
2. SpaceOfMyHead 200 09.06.23 11:07 Сейчас в теме
(1) Никаких тестов (кроме юнит) пока не проводил. Изначально цель была чисто академическая, но результат показал вполне практичный потенциал. Сейчас в планах дополнить функционал шаблона. Затем будет оптимизация. А после этого можно будет что-либо говорить об эффективности.

По поводу 23й платформы. Там (если я правильно понимаю, сам ещё не пробовал) регулярки доступны только на сервере. Здесь же можно выполнять на клиенте и на более старых версиях платформы.
Светлый ум; Dmitri93; +2 Ответить
3. Segate 283 09.06.23 11:59 Сейчас в теме
(1) а в режиме совместимости они работают? ) Если нет, то даже в типовых еще пара лет для этой разработки есть )
(0) Всякие positive/negative lookahead есть? lazy/greedy алгоритмы и тд?
SpaceOfMyHead; +1 Ответить
4. SpaceOfMyHead 200 09.06.23 12:13 Сейчас в теме
(3) Пока только перечисленные в статье. Изначально ориентировался на Java 8 regex.Pattern. Но видимо теперь надо больше поглядывать на ICU (стандарт платформы 23й версии).

Но есть планы добавить этот функционал насколько хватит мозга - помощь коллег в развитии библиотеки будет очень кстати!
5. Diversus 2336 09.06.23 13:05 Сейчас в теме
Есть вот такая, замечательная ВК RegEx1CAddin, которая умеет больше, чем та, что в 23 версии платформы.

Работает на:
* Windows 32bit
* Windows 64bit
* Linux 32bit
* Linux 64bit
* MacOS 64bit
* Android ARMv7-A
* Android x86-64
* Google Chrome (Linux, Windows)
user2043085; SerVer1C; bprogs; quazare; kser87; +5 Ответить
8. tormozit 7307 10.06.23 15:50 Сейчас в теме
(5) Компонента хороша, но работает в разы медленнее особенно если результат большой (много времени уходит на его передачу из внешней компоненты). А функциональности регулярных выражений 8.3.23 хватит для подавляющего большинства задач. ИР обильно использует регулярные выражения и я успешно протестировал его работу на регулярках 8.3.23 и этой компоненты и VBScript.
Скорость на клиенте:
1. VBScript (самый быстрый)
2. 8.3.23
3. RegEx1CAddin
Скорость на сервере:
1. 8.3.23 (самый быстрый)
2. RegEx1CAddin
3. VBScript
mikeA; SergDobrodelov; dvsidelnikov; anderson; ixijixi; +5 Ответить
11. tormozit 7307 11.06.23 11:25 Сейчас в теме
(8) При замерах RegEx1CAddin я использовал только метод MatchesJSON()
12. bprogs 2 11.06.23 21:42 Сейчас в теме
(11) Там по умолчанию компонента почему то постоянно заново инициализируется, как бы Алексей походу забыл его снять с постоянной реиницализации или что то в этом духе, у меня тоже в начале жесткие тормоза были потом я просто в контекст эту компоненту закинул ,вуаля скорость в 50 раз выросла, ну там в общем нужно во всех методах когда вызываешь регулярку, нужно последним параметром передать компоненту ,а не идти по пути который там у него по умолчанию
13. tormozit 7307 11.06.23 23:21 Сейчас в теме
(12) Звучит как будто ты даже не пытался сравнивать скорость с VBScript и 1С 8.3.23. Я же этим обширно занимался в тесном контакте с автором https://github.com/alexkmbk/RegEx1CAddin/issues/7 . Сомневаюсь что автор там что то "забыл снять" и до сих пор не исправил.
native-api; +1 Ответить
14. bprogs 2 11.06.23 23:29 Сейчас в теме
(13) Да я не сравнивал скорость, уверен что родные механизмы будут намного быстрее работать, родные в плане в какойто определенной среде, так то я не хотел сказать что остальные решения хуже, я просто поделился тем как я боролся с тем что бы ускорить компоненту, ну так то тот кто разрабатывал может оставил посыл что б все остальное сами реализовывали ))))
20. native-api 26 28.11.24 12:38 Сейчас в теме
(14) Пробовал избавиться от переинициализации компоненты RegEx1CAddin, и выяснил:

* В пределах одного серверного вызова можно получить объект компоненты через "КомпонентаРаботыСРегулярнымиВыражениями()" и передавать его в вызовы библиотеки
* В разных серверных вызовах повторных вызовов "ПодключитьВнешнююКомпоненту()" не избежать, т.к. результат негде сохранить между вызовами. Согласно СП по ПодключитьВнешнююКомпоненту, "Компонент кэшируется на сеанс работы сервера", так что это не должно сильно повышать накладные расходы (по сравнению с уже имеющимися накладными расходами на вызовы внешней компоненты).
6. ixijixi 2047 09.06.23 21:41 Сейчас в теме
Хорошая вещь, плюсанул. Вот бы еще кто сделал конструктор построения шаблонов рег. выражений.... А то пользуешься ими раз в полгода, а из головы уже все выветрилось.
realsevere; 0x00; +2 Ответить
7. tormozit 7307 10.06.23 13:13 Сейчас в теме
Конструктор регулярных выражений (ИР) есть. Поддерживает все 3 движка включая генерацию кода:
- RegEx1CAddin
- VBscript
- 1C 8.3.23
CSiER; sasha777666; native-api; Rafaraf; fancy; SirStefan; anderson; FuJluH; ixijixi; JohnyDeath; Xershi; +11 Ответить
19. SergDobrodelov 722 01.10.24 09:37 Сейчас в теме
9. nixel 1463 10.06.23 20:20 Сейчас в теме
(6) не совсем тоже самое, но есть вот такой проект: https://github.com/oscript-library/verbal-expressions
tormozit; dmpas; +2 Ответить
10. Evg-Lylyk 5176 10.06.23 21:03 Сейчас в теме
Это штука будет полезна так как работает без библиотек и Com. Нужна замена когда нет регулярок платформы.
16. SpaceOfMyHead 200 13.06.23 13:27 Сейчас в теме
(15)
aHR0cHM6Ly9naXRodWIuY29tL1NwYWNlSGVhZDFDLzFjX3JlZ2V4cA==­

Это base64 от "https://github.com/SpaceHead1C/1c_regexp" (гитхаб проекта)

(15)
aHR0cHM6Ly9naXRodWIuY29tL1NwYWNlSGVhZDFDLzFjX3JlZ2V4cC9y­ZWxlYXNlcw==

А это от "https://github.com/SpaceHead1C/1c_regexp/releases" (бинарники на скачивание)

Должно открываться...
17. brr 184 13.06.23 22:54 Сейчас в теме
18. пользователь 01.08.24 08:49
Сообщение было скрыто модератором.
...
21. user786882 14 21.01.25 22:59 Сейчас в теме
Эх, вспомнился институт, 3-й курс. Вполне сошло бы за курсач. Люблю конечные автоматы.
Для отправки сообщения требуется регистрация/авторизация