Регулярные выражения на 1С

11.03.24

Разработка - Математика и алгоритмы

Что ж... лучше поздно, чем никогда. Подсистема 1С для работы с регулярными выражениями: разбор выражения, проверка на соответствие шаблону, поиск вхождений в тексте.

Скачать файл

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование SM По подписке [?] Купить один файл
Регулярные выражения:
.cf 14,78Kb
4
4
1 SM
Скачать Купить за 1 850 руб.
Регулярные выражения (расширение):
.cfe 13,69Kb
3
3
1 SM
Скачать Купить за 1 850 руб.

Подсистема 1С для работы с регулярными выражениями

 

Вдохновившись материалами книг по алгоритмам и структурам данных, я сделал подсистему работы с регулярными выражениями для 1С. Доступный функционал:

  • Построение процессора регулярного выражения по шаблону
  • Проверка полного соответствия текста регулярному выражению
  • Поиск вхождений в тексте по регулярному выражению

 

Реализованы следующие элементы построения регулярных выражений:

  • Операции: |()
  • Квантификаторы: *+?{n}{, n}{n, }{n, m}
  • Символы: .\\t\n\r\f\a\e\xhh\uhhhh
  • Классы символов: [abc][^x-z]
  • Предопределённые классы символов: \d\D\h\H\s\S\v\V\w\W

 

Подсистема обходится исключительно средствами платформы 1С. Отрабатывает на клиенте и сервере (методы глобального контекста в 8.3.23 доступны только на сервере).

В основе движка подсистемы недетерминированный конечный автомат. PDF презентации по материалам книги Роберта Сэджвика и Кевина Уэйна.

 

Разрабатывается на платформах 8.3.21.1302 и 8.3.10.2667

Требуемая минимальная версия: 8.3.6 

Требуемая минимальная версия расширения: 8.3.9

 

Ограничения платформы можно существенно снизить, избавившись от типов Фиксированных коллекций и функции СтрСоединить. Вплоть до 8.1.

 

Пример кода

 

Проверка соответствия всей строки шаблону (процессор можно переиспользовать):

Шаблон = "(A*B|\d)D";
Процессор = Регулярка.ПроцессорРаспознавания(Шаблон);

Сообщить(Регулярка.Распознано(Процессор, "D")); // Ложь
Сообщить(Регулярка.Распознано(Процессор, "3D")); // Истина
Сообщить(Регулярка.Распознано(Процессор, "BD")); // Истина
Сообщить(Регулярка.Распознано(Процессор, "AD")); // Ложь
Сообщить(Регулярка.Распознано(Процессор, "AAAAAABD")); // Истина

 

Поиск вхождений в тексте:

Процессор = Регулярка.ПроцессорРаспознавания("\n");

Текст =
    "Белеет парус одинокой
    |В тумане моря голубом. —
    |Что ищет он в стране далекой?
    |Что кинул он в краю родном?";

Вхождения = Регулярка.Вхождения(Процессор, Текст);

 

PS

 

Репозитарий на github

Надеюсь, будет хватать времени на развитие проекта. Буду благодарен помощи заинтересованных.

Бесплатно Регулярку скачать можно тут. А если хотите выразить благодарность в виде SM – с радостью буду за них приобретать на Инфостарте разработки коллег.

regexp регулярные выражения регулярки конфигурация подсистема поиск модуль библиотека конечный автомат текст нка

См. также

Инструментарий разработчика Роли и права Запросы СКД Программист Платформа 1С v8.3 Управляемые формы Запросы Система компоновки данных Конфигурации 1cv8 Платные (руб)

Набор инструментов программиста и специалиста 1С для всех конфигураций на управляемых формах. В состав входят инструменты: Консоль запросов, Консоль СКД, Консоль кода, Редактор объекта, Анализ прав доступа, Метаданные, Поиск ссылок, Сравнение объектов, Все функции, Подписки на события и др. Редактор запросов и кода с раскраской и контекстной подсказкой. Доработанный конструктор запросов тонкого клиента. Продукт хорошо оптимизирован и обладает самым широким функционалом среди всех инструментов, представленных на рынке.

10000 руб.

02.09.2020    140727    772    391    

803

Пакетная печать Печатные формы Инструментарий разработчика Программист Платформа 1С v8.3 Запросы 1С:Зарплата и кадры бюджетного учреждения 1С:Конвертация данных 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 Платные (руб)

Инструмент, позволяющий абсолютно по-новому взглянуть на процесс разработки печатных форм. Благодаря конструктору можно значительно снизить затраты времени на разработку печатных форм, повысить качество и "прозрачность" разработки, а также навести порядок в многообразии корпоративных печатных форм.

18000 руб.

06.10.2023    11566    31    6    

61

Инструментарий разработчика Программист Платформа 1С v8.3 Конфигурации 1cv8 Платные (руб)

Инструмент для написания и отладки кода в режиме «1С:Предприятие». Представляет собой консоль кода с возможностью пошаговой отладки, просмотра значений переменных любых типов, использования процедур и функций, просмотра стека вызовов, вычисления произвольных выражений на встроенном языке в контексте точки останова, синтаксического контроля и остановки по ошибке. В консоли используется удобный редактор кода с подсветкой, контекстной подсказкой, возможностью вызова конструкторов запроса и форматной строки.

5400 руб.

17.05.2024    13887    33    27    

75

Инструменты администратора БД Инструментарий разработчика Роли и права Программист Платформа 1С v8.3 Конфигурации 1cv8 Россия Платные (руб)

Расширение позволяет без изменения кода конфигурации выполнять проверки при вводе данных, скрывать от пользователя недоступные ему данные, выполнять код в обработчиках. Не изменяет данные конфигурации, легко устанавливается практически на любую конфигурацию на управляемых формах.

10000 руб.

10.11.2023    7290    27    4    

51

SALE! %

Инструментарий разработчика Инструменты администратора БД Системный администратор Программист Платформа 1С v8.3 Управляемые формы Конфигурации 1cv8 Россия Платные (руб)

Универсальный инструмент программиста для администрирования конфигураций. Сборник наиболее часто используемых обработок под единым интерфейсом.

3600 2880 руб.

14.01.2013    181894    1104    0    

876

Инструментарий разработчика Программист 8.3.14 1С:Конвертация данных Россия Платные (руб)

Расширение для конфигурации “Конвертация данных 3”. Добавляет подсветку синтаксиса, детальную контекстную подсказку, глобальный поиск по коду.

15000 руб.

07.10.2021    15991    3    12    

39

Инструментарий разработчика Программист Платформа 1С v8.3 Конфигурации 1cv8 Россия Платные (руб)

Восстановление партий или взаиморасчетов, расчет зарплаты, пакетное формирование документов или отчетов - теперь все это стало доступнее. * Есть желание повысить скорость работы медленных алгоритмов! Но... * Нет времени думать о реализации многопоточности? * о запуске и остановке потоков? * о поддержании потоков в рабочем состоянии? * о передаче данных в потоки и как получить ответ из потока? * об организации последовательности? Тогда ЭТО - то что надо!!!

5000 руб.

07.02.2018    101133    242    97    

303

Инструментарий разработчика Перенос данных 1C Программист Платформа 1С v8.3 Платные (руб)

В процессе работы в 1С часто возникает потребность получить данные из другой базы. Обычно это делается через COM-соединение, и время выполнения запроса при этом оставляет желать лучшего. В данной публикации представлено универсальное решение для 1С, позволяющее практически моментально выполнить произвольный код или запрос с параметрами в другой информационной базе через Web-сервис.

2400 руб.

24.09.2019    24506    17    15    

34
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. SerVer1C 785 09.06.23 11:01 Сейчас в теме
Да, припоздали вы. С 23-й платформы регулярки уже нативно встроены в язык. Насколько ваш вариант на 1с быстро работает по сравнению с VBScript.RegExp ?
2. SpaceOfMyHead 193 09.06.23 11:07 Сейчас в теме
(1) Никаких тестов (кроме юнит) пока не проводил. Изначально цель была чисто академическая, но результат показал вполне практичный потенциал. Сейчас в планах дополнить функционал шаблона. Затем будет оптимизация. А после этого можно будет что-либо говорить об эффективности.

По поводу 23й платформы. Там (если я правильно понимаю, сам ещё не пробовал) регулярки доступны только на сервере. Здесь же можно выполнять на клиенте и на более старых версиях платформы.
Светлый ум; Dmitri93; +2 Ответить
3. Segate 237 09.06.23 11:59 Сейчас в теме
(1) а в режиме совместимости они работают? ) Если нет, то даже в типовых еще пара лет для этой разработки есть )
(0) Всякие positive/negative lookahead есть? lazy/greedy алгоритмы и тд?
SpaceOfMyHead; +1 Ответить
4. SpaceOfMyHead 193 09.06.23 12:13 Сейчас в теме
(3) Пока только перечисленные в статье. Изначально ориентировался на Java 8 regex.Pattern. Но видимо теперь надо больше поглядывать на ICU (стандарт платформы 23й версии).

Но есть планы добавить этот функционал насколько хватит мозга - помощь коллег в развитии библиотеки будет очень кстати!
5. Diversus 2325 09.06.23 13:05 Сейчас в теме
Есть вот такая, замечательная ВК RegEx1CAddin, которая умеет больше, чем та, что в 23 версии платформы.

Работает на:
* Windows 32bit
* Windows 64bit
* Linux 32bit
* Linux 64bit
* MacOS 64bit
* Android ARMv7-A
* Android x86-64
* Google Chrome (Linux, Windows)
user2043085; SerVer1C; bprogs; quazare; kser87; +5 Ответить
8. tormozit 7193 10.06.23 15:50 Сейчас в теме
(5) Компонента хороша, но работает в разы медленнее особенно если результат большой (много времени уходит на его передачу из внешней компоненты). А функциональности регулярных выражений 8.3.23 хватит для подавляющего большинства задач. ИР обильно использует регулярные выражения и я успешно протестировал его работу на регулярках 8.3.23 и этой компоненты и VBScript.
Скорость на клиенте:
1. VBScript (самый быстрый)
2. 8.3.23
3. RegEx1CAddin
Скорость на сервере:
1. 8.3.23 (самый быстрый)
2. RegEx1CAddin
3. VBScript
anderson; ixijixi; +2 Ответить
11. tormozit 7193 11.06.23 11:25 Сейчас в теме
(8) При замерах RegEx1CAddin я использовал только метод MatchesJSON()
12. bprogs 218 11.06.23 21:42 Сейчас в теме
(11) Там по умолчанию компонента почему то постоянно заново инициализируется, как бы Алексей походу забыл его снять с постоянной реиницализации или что то в этом духе, у меня тоже в начале жесткие тормоза были потом я просто в контекст эту компоненту закинул ,вуаля скорость в 50 раз выросла, ну там в общем нужно во всех методах когда вызываешь регулярку, нужно последним параметром передать компоненту ,а не идти по пути который там у него по умолчанию
13. tormozit 7193 11.06.23 23:21 Сейчас в теме
(12) Звучит как будто ты даже не пытался сравнивать скорость с VBScript и 1С 8.3.23. Я же этим обширно занимался в тесном контакте с автором https://github.com/alexkmbk/RegEx1CAddin/issues/7 . Сомневаюсь что автор там что то "забыл снять" и до сих пор не исправил.
native-api; +1 Ответить
14. bprogs 218 11.06.23 23:29 Сейчас в теме
(13) Да я не сравнивал скорость, уверен что родные механизмы будут намного быстрее работать, родные в плане в какойто определенной среде, так то я не хотел сказать что остальные решения хуже, я просто поделился тем как я боролся с тем что бы ускорить компоненту, ну так то тот кто разрабатывал может оставил посыл что б все остальное сами реализовывали ))))
6. ixijixi 1833 09.06.23 21:41 Сейчас в теме
Хорошая вещь, плюсанул. Вот бы еще кто сделал конструктор построения шаблонов рег. выражений.... А то пользуешься ими раз в полгода, а из головы уже все выветрилось.
realsevere; 0x00; +2 Ответить
7. tormozit 7193 10.06.23 13:13 Сейчас в теме
Конструктор регулярных выражений (ИР) есть. Поддерживает все 3 движка включая генерацию кода:
- RegEx1CAddin
- VBscript
- 1C 8.3.23
native-api; Rafaraf; fancy; SirStefan; anderson; FuJluH; ixijixi; JohnyDeath; Xershi; +9 Ответить
9. nixel 1422 10.06.23 20:20 Сейчас в теме
(6) не совсем тоже самое, но есть вот такой проект: https://github.com/oscript-library/verbal-expressions
tormozit; dmpas; +2 Ответить
10. Evg-Lylyk 4764 10.06.23 21:03 Сейчас в теме
Это штука будет полезна так как работает без библиотек и Com. Нужна замена когда нет регулярок платформы.
16. SpaceOfMyHead 193 13.06.23 13:27 Сейчас в теме
(15)
aHR0cHM6Ly9naXRodWIuY29tL1NwYWNlSGVhZDFDLzFjX3JlZ2V4cA==­

Это base64 от "https://github.com/SpaceHead1C/1c_regexp" (гитхаб проекта)

(15)
aHR0cHM6Ly9naXRodWIuY29tL1NwYWNlSGVhZDFDLzFjX3JlZ2V4cC9y­ZWxlYXNlcw==

А это от "https://github.com/SpaceHead1C/1c_regexp/releases" (бинарники на скачивание)

Должно открываться...
17. brr 184 13.06.23 22:54 Сейчас в теме
Оставьте свое сообщение