Использование регулярных выражений (RegExp) в 1С8.х

17.02.10

Разработка - Инструментарий разработчика

1. Использование
2. Достоинства RegExp
3. Отладка и проверка (RegExBuddy)
4. "Обертки"
5. Примеры использования (полезные универсальные функции)
6. Заключение

Скачать файл

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование По подписке [?] Купить один файл
Пример 8.1. Тест. Сравнение скорости RegExp и встроенного языка на функции разбора 1,2,3
.epf 8,11Kb
347
347 Скачать (1 SM) Купить за 1 850 руб.

Данный материал касается платформы 8.х

О функциях и формате шаблона RegExp подробно можно почитать здесь:
http://ru.wikipedia.org/wiki/Регулярные_выражения
http://www.script-coding.info/WSH/RegExp.html
Книга Михайлов А. Системное программирование в 1С: Предприятии 7.7/8.0 (Глава 1. "Применение технологий СОМ и ActiveX" - "Регулярные выражения")

библиотека RegExp является предустановленной т.е. есть в любом Windows

 

Возможности регулярных выражений:
Сравнить текст с заданным шаблоном (метод Test).
Заменить или удалить из  строки текст, соответствующий заданному шаблону (метод Replace).
Извлечь из строки текст, соответствующий заданному шаблону (метод Execute).

1. Использование 

RegExp используется в 1С через COM интерфейс пример кода:

RegExp = Новый COMОбъект("VBScript.RegExp");// создаем объект для работы с регулярными выражениями
RegExp.MultiLine = Истина;  // истина — текст многострочный, ложь — одна строка
RegExp.Global = Истина;     // истина — поиск по всей строке, ложь — до первого совпадения
RegExp.IgnoreCase = Истина; // истина — игнорировать регистр строки при поиске

Шаблон = ".+@.+\..+"; //шаблон проверки e-mail

RegExp.Pattern = Шаблон;    // шаблон (регулярное выражение)

ПроверяемыйEMail = "test@mail.ru";

Если Не
RegExp.Test(ПроверяемыйEMail) Тогда
   
Сообщить("Некорректный email");
КонецЕсли;

о методах и свойствах можно почитать подробно здесь

2. Достоинства RegExp

Плюсы:

  • хорошая скорость анализа т.к. 1С анализ строк (разбор) обычно реализуется циклами и функциями: Лев, Прав, Сред, Найти, а встроенный язык медленный
  • высокая читаемость и модифицированность (более предсказуем в случае несоответствия строки - разбору)
  • доп. функционал (можно осуществлять анализ, замену и проверку строковых выражений)

Минусы:

  • не все задачи можно решить (например рекурсивные разборы тип 1 + (2+3*(2-7)) в случае если нужно разобрать на выражения в скобках) приходится смешивать с кодом
  • Возможны зависания при использовании сложных шаблонов. Отладчик RegExBuddy в таких ситуациях пишет о невозможности получить результат за разумное число итераций
  • RegExp доп. библиотека (инициализация занимает значительное время)

  основное достоинство RegExp это читаемость

3. Отладка и проверка (RegExBuddy) 

Отладка регулярных выражений довольно частая задача т.к. бывает трудно понять и сам шаблон и ошибки в разборе. Наиболее удобным инструментом на мой взгляд является программа RegexBuddy (внешний вид программы есть в скриншотах) она осуществляет подцветку разбираемых выражений и многое другое, есть все что нужно и даже больше. Очень простой в использовании инструмент.

Также есть тестер 8.1 от coder1cv8, но в нем к сожалению нет подвыражений и запускается только из 1С8.

4. "Обертки"

При частом использовании RegExp приходится делать более удобные и читаемые "оберки" (+ русифицированные) Внимание! Данные функции более медленные

Код функций:

Перем RegExp;

//RegExp --------------------------------------------------------

Процедура РегулярныеВыражения_Инициализация (Шаблон, ИскатьДоПервогоСовпадения = Истина, МногоСтрок = Истина, ИгнорироватьРегистр = Истина) Экспорт

    Если
RegExp = Неопределено Тогда //Нужна инициализация
       
RegExp = Новый COMОбъект("VBScript.RegExp");    // создаем объект для работы с регулярными выражениями
   
КонецЕсли;

   
//Заполняем данные
   
RegExp.MultiLine = МногоСтрок;                  // истина — текст многострочный, ложь — одна строка
   
RegExp.Global = Не ИскатьДоПервогоСовпадения;   // истина — поиск по всей строке, ложь — до первого совпадения
   
RegExp.IgnoreCase = ИгнорироватьРегистр;        // истина — игнорировать регистр строки при поиске
   
RegExp.Pattern = Шаблон;                        // шаблон (регулярное выражение)

КонецПроцедуры

Функция
РегулярныеВыражения_Проверка(ПроверяемыйТекст)

    Возврат
RegExp.Test(ПроверяемыйТекст);

КонецФункции

Функция РегулярныеВыражения_Выполнить(АнализируемыйТекст) Экспорт

   
РезультатАнализаСтроки = RegExp.Execute(АнализируемыйТекст);

   
МассивВыражений = Новый Массив;

    Для Каждого
Выражение Из РезультатАнализаСтроки Цикл
       
СтруктураВыражение = Новый Структура ("Начало, Длина, Значение, ПодВыражения", Выражение.FirstIndex, Выражение.Length,Выражение.Value);

       
//Обработка подвыражений
       
МассивПодВыражений = Новый Массив;
        Для Каждого
ПодВыражение Из Выражение.SubMatches Цикл
           
МассивПодВыражений.Добавить(ПодВыражение);
        КонецЦикла;
       
СтруктураВыражение.ПодВыражения = МассивПодВыражений;

       
МассивВыражений.Добавить (СтруктураВыражение);

    КонецЦикла;

    Возврат
МассивВыражений;

КонецФункции

//RegExp --------------------------------------------------------

 

Использование  на примере с email:

РегулярныеВыражения_Инициализация (".+@.+\..+");

ПроверяемыйEMail = "test@mail.ru";
Если Не
РегулярныеВыражения_Проверка(ПроверяемыйEMail) Тогда
   
Сообщить("Некорректный email");
КонецЕсли;

5. Примеры использования (полезные универсальные функции)

Функция ПодставитьПараметрыВСтроку (СтрокаШаблон, Коллекция) - подставляет в строку параметры из коллекции

   СтрокаШаблон - строка вида "Текст [Параметр]" параметры должны быть заключены в квадратные скобки

   Коллекция - коллекция из которой будут подбираться одноименные параметры

Пример: ПодставитьПараметрыВСтроку ("Выполнено: [ВыполненоПроцент]%", Новый Структура ("ВыполненоПроцент",50));

Результатом выполнения будет строка : "Выполнено: 50%"


Функция РазложитьСтрокуВМассив (Строка, Разделитель = ",") - возвращает массив полученный из строки  элементами которого являются строки разделенные разделителем (эта функция есть практически в любой конфигурации от  1С)

  Строка - строка из которой берем данные

  Разделитель -  символ разделитель (по умолчанию ",")

Пример: РазложитьСтрокуВМассив("1,23,45");

Результатом выполнения будет массив строк : "1","23","45"


Код функций:

Функция ПодставитьПараметрыВСтроку (Шаблон, КоллекцияЗаполнения) Экспорт

   
РегулярныеВыражения_Инициализация ("\[([\d\wЁА-Я]+)\]", Ложь);
   
НайденныеПараметры = РегулярныеВыражения_Выполнить(Шаблон);

   
НовыйТекст = Шаблон;

    Для Каждого
Параметр Из НайденныеПараметры Цикл

       
//Получим имя параметра
       
ИмяПараметра = Параметр.ПодВыражения[0];//Первый элемент

       
Попытка //Параметр может отсутствовать в коллекции
            //Получим значение параметра
           
ЗначениеПараметра = КоллекцияЗаполнения[ИмяПараметра];

           
//Подстановка параметров
           
НовыйТекст = СтрЗаменить(НовыйТекст, Параметр.Значение, ЗначениеПараметра);
        Исключение
        КонецПопытки;

    КонецЦикла;

    Возврат
НовыйТекст;

КонецФункции

Функция РазложитьСтрокуВМассив(Строка, Разделитель = ",") Экспорт

   
//Разбор строки вида 1,СЛОВО,(1+2); Маска для разделителя ',' ([^\,]+),?"
   
РегулярныеВыражения_Инициализация ("[^\" + Разделитель + "]+", Ложь, Ложь, Ложь);
   
Выражения = РегулярныеВыражения_Выполнить(Строка);

   
Массив = Новый Массив;

    Для Каждого
Выражение Из Выражения Цикл
       
Массив.Добавить(Выражение.Value);
    КонецЦикла;

    Возврат
Массив;

КонецФункции

 

Можно было привести более сложные примеры, но они бы имели узкую направленность.

6. Заключение

RegExp имеет хорошую скорость обработки и отличную читаемость .

На регулярах построены многие интересные разработки на инфостарте:

Разукрашка (1.4.1.5) alexk-is

Раскрашивание текста запроса 

[2 in 1] «Обфускация кода 1С» и «RegExp Тестер» от coder1c8

т.е. везде где нужна низкоуровневая обработка текста (разбор различных текстовых данных) хороший выбор это регуляры.

в файлах есть пример кода на RegExp и сравнение скорости

 

См. также

Инструментарий разработчика Роли и права Запросы СКД Программист Руководитель проекта Платформа 1С v8.3 Управляемые формы Запросы Система компоновки данных Платные (руб)

Инструменты для разработчиков 1С 8.3: Infostart Toolkit. Автоматизация и ускорение разработки на управляемых формах. Легкость работы с 1С.

12000 руб.

02.09.2020    169292    937    403    

905

Инструментарий разработчика Чистка данных Свертка базы Инструменты администратора БД Системный администратор Программист Руководитель проекта Платформа 1С v8.3 Россия Платные (руб)

Инструмент представляет собой обработку для проведения свёртки или обрезки баз данных. Работает на ЛЮБЫХ конфигурациях (УТ, БП, ERP и т.д.). Поддерживаются серверные и файловые базы, управляемые и обычные формы. Может выполнять свертку сразу нескольких баз данных и выполнять их автоматически без непосредственного участия пользователя. Решение в Реестре отечественного ПО

8400 руб.

20.08.2024    12610    99    42    

101

Инструментарий разработчика Программист Платформа 1С v8.3 Конфигурации 1cv8 Платные (руб)

Инструмент для написания и отладки кода в режиме «1С:Предприятие». Представляет собой консоль кода с возможностью пошаговой отладки, просмотра значений переменных любых типов, использования процедур и функций, просмотра стека вызовов, вычисления произвольных выражений на встроенном языке в контексте точки останова, синтаксического контроля и остановки по ошибке. В консоли используется удобный редактор кода с подсветкой, контекстной подсказкой, возможностью вызова конструкторов запроса и форматной строки.

9360 руб.

17.05.2024    26537    90    48    

134

Пакетная печать Печатные формы Инструментарий разработчика Программист Платформа 1С v8.3 Запросы 1С:Зарплата и кадры бюджетного учреждения 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 Платные (руб)

Инструмент, позволяющий абсолютно по-новому взглянуть на процесс разработки печатных форм. Благодаря конструктору можно значительно снизить затраты времени на разработку печатных форм, повысить качество и "прозрачность" разработки, а также навести порядок в многообразии корпоративных печатных форм.

22200 руб.

06.10.2023    16829    41    15    

75

SALE! %

Инструментарий разработчика Инструменты администратора БД Системный администратор Программист Платформа 1С v8.3 Управляемые формы Конфигурации 1cv8 Россия Платные (руб)

Универсальный инструмент программиста для администрирования конфигураций. Сборник наиболее часто используемых обработок под единым интерфейсом.

4800 3840 руб.

14.01.2013    190552    1150    0    

918

Инструменты администратора БД Инструментарий разработчика Роли и права Программист Платформа 1С v8.3 Конфигурации 1cv8 Россия Платные (руб)

Расширение позволяет без изменения кода конфигурации выполнять проверки при вводе данных, скрывать от пользователя недоступные ему данные, выполнять код в обработчиках. Не изменяет данные конфигурации, легко устанавливается практически на любую конфигурацию на управляемых формах.

15000 руб.

10.11.2023    11396    40    27    

66

Инструментарий разработчика Платформа 1С v8.3 Конфигурации 1cv8 1С:ERP Управление предприятием 2 Платные (руб)

Разработка Конструктор автоматизированных рабочих мест "Конструктор АРМ" реализована в виде расширения и является универсальным инструментом для создания АРМ любой сложности в пользовательском режиме.

3600 руб.

27.12.2024    778    2    0    

4

Инструментарий разработчика Программист Платформа 1С v8.3 Конфигурации 1cv8 Россия Платные (руб)

Восстановление партий или взаиморасчетов, расчет зарплаты, пакетное формирование документов или отчетов - теперь все это стало доступнее. * Есть желание повысить скорость работы медленных алгоритмов! Но... * Нет времени думать о реализации многопоточности? * о запуске и остановке потоков? * о поддержании потоков в рабочем состоянии? * о передаче данных в потоки и как получить ответ из потока? * об организации последовательности? Тогда ЭТО - то что надо!!!

5000 руб.

07.02.2018    103927    244    100    

306
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. Арчибальд 2709 25.01.10 19:15 Сейчас в теме
2. Душелов 4021 25.01.10 19:24 Сейчас в теме
3. Saint 25.01.10 20:33 Сейчас в теме
Хорошая статья. Единственное дополнение: при реальном использовании обёрток возможно более удобным будет оформить их в отдельном общем модуле. Типа эмуляция класса. :D
sogesti; Evg-Lylyk; +2 Ответить
4. Evg-Lylyk 4894 25.01.10 20:44 Сейчас в теме
(3) Спасибо. Надо подумать как это поудобнее оформить.
5. awk 745 25.01.10 20:52 Сейчас в теме
(0) Жаль в VBS регулярные выражения кастрированы...
6. Душелов 4021 25.01.10 22:09 Сейчас в теме
(5) Я свою компоненту набросал для использования нетовских регулярных выражений из 1с-ки.
7. Evg-Lylyk 4894 25.01.10 22:16 Сейчас в теме
(6) главное чтобы без NET ;)
8. Душелов 4021 25.01.10 23:03 Сейчас в теме
(7) У меня НЕТ везде стоит, так что на счет этого не беспокоюсь вообще.
9. Evg-Lylyk 4894 25.01.10 23:22 Сейчас в теме
(8) меня больше беспокоит где он не стоит :D
10. tormozit 7245 26.01.10 08:39 Сейчас в теме
Из минусов обязательно нужно упомянуть возможность зависания при использовании сложных шаблонов. Отладчик RegExBuddy в таких ситуациях пишет о невозможности получить результат за разумное число итераций.
Evg-Lylyk; +1 Ответить
14. Evg-Lylyk 4894 26.01.10 12:30 Сейчас в теме
(10) Хорошо... я с подобным не сталкивался. Здорово если бы был примерчик такого шаблона с которым зависает
(11) Если хорошо поискать можно найти и "русскую версию" ;)
(12) По сравнению со встроенным языком это как мне кажется не ограниченность
Было бы здорово если бы 1С встроила поддержу RegExp на уровне платформы наконец то за код Лев(Стр,Найти(... можно будет проклинать :)
11. Stepa86 1532 26.01.10 08:54 Сейчас в теме
RegExBuddy - платная только?
12. coder1cv8 3479 26.01.10 09:34 Сейчас в теме
А где книжечку с "обложки" публикации скачать можно? :)

Из минусов я бы отметил еще ограниченность регэкспов в VBS (тут об этом уже упоминалось), нет "просмотра назад" в частности, что меня очень огорчило, когда я писал свой обфускатор...
81. levante90 09.03.22 10:24 Сейчас в теме
(12) в 2022 так и не появился просмотр назад. Как-то обошли эту ситуацию?
82. madonov 259 13.07.23 10:14 Сейчас в теме
(81)
осмотр назад. Как-то обошли эт

2023 - вопрос тот же
13. Totoro 572 26.01.10 10:24 Сейчас в теме
(0) Доступно и понятно. Молодец.
(12) Например на Infanata
15. aipnnov 167 26.01.10 14:29 Сейчас в теме
Очень хорошо написано и понятно.
83. kuzyara 2106 14.12.23 06:43 Сейчас в теме
(15) доступно с 8.3.23
СтрНайтиПоРегулярномуВыражению (StrFindByRegularExpression)
Синтаксис:
СтрНайтиПоРегулярномуВыражению(<Строка>, <РегулярноеВыражение>, <НаправлениеПоиска>, <НачальнаяПозиция>, <НомерВхождения>, <ИгнорироватьРегистр>, <МногострочныйПоиск>)
Возвращаемое значение:
Тип: РезультатПоискаПоРегулярномуВыражению.
Описание:
Находит первое вхождение регулярного выражения в исходной строке.
Доступность:
Сервер, толстый клиент, внешнее соединение, мобильное приложение (сервер).
Пример:
Строка = "Roses are #ff0000";
РегулярноеВыражение = "#([a-f0-9]{6})";

РезультатПоиска = СтрНайтиПоРегулярномуВыражению(Строка, РегулярноеВыражение);
Если РезультатПоиска.НачальнаяПозиция <> 0 Тогда
    СтрокаРезультат = СРед(Строка,
        РезультатПоиска.НачальнаяПозиция, РезультатПоиска.Длина);
КонецЕсли;
Использование в версии:
Доступен, начиная с версии 8.3.23.
16. alexk-is 6544 26.01.10 18:03 Сейчас в теме
Скачал. Запустил. Получил:
Выполнений: 100 функций на RegExp время: 172 мс
Выполнений: 100 Функции из Бух 1.6 и КОРП 2.0 время: 78 мс

Мне показалось, что должно быть наоборот. Что я делаю не так?
Прикрепленные файлы:
17. Душелов 4021 26.01.10 18:09 Сейчас в теме
(16) Думаю, что из теста времени надо убрать время на создание ком-объекта.
18. alexk-is 6544 26.01.10 18:25 Сейчас в теме
(17) Ком-объект создается и настраивается при открытии обработки в её модуле. Проверил в отладчике - отрабатывается 1 раз при открытии...

Думал время определяет неправильно. Добавил циклов. Получил:
Выполнений: 1 000 функций на RegExp время: 1 781 мс
Выполнений: 1 000 Функции из Бух 1.6 и КОРП 2.0 время: 703 мс
19. Душелов 4021 26.01.10 18:33 Сейчас в теме
(18) А что за обработка? Дай посмотреть ;)
20. alexk-is 6544 26.01.10 18:38 Сейчас в теме
(19) Вверху страницы "Скачать Пример. Тест. Сравнение скорости..."
21. alexk-is 6544 26.01.10 18:48 Сейчас в теме
+18 Думал из-за конфигурации. Запустил в УПП. Получил:
Выполнений: 1 000 функций на RegExp время: 1 719 мс
Выполнений: 1 000 Функции из Бух 1.6 и КОРП 2.0 время: 625 мс
22. Душелов 4021 26.01.10 18:59 Сейчас в теме
Выполнений: 100 функций на RegExp время: 445 мс
Выполнений: 100 Функции из Бух 1.6 и КОРП 2.0 время: 341 мс
23. alexk-is 6544 26.01.10 19:18 Сейчас в теме
(22) Ну, вот. Хоть и не большой, а перевес в сторону 1С. :(
Видимо у меня ПК немного побыстрее и 1С отрабатывает на нем оптимальнее чем RegExp.
24. Душелов 4021 26.01.10 19:23 Сейчас в теме
(23) А мне кажется, что тут дело в кэшировании... Надо бы тест переделать на рандомную последовательность разбираемой строки...
25. alexk-is 6544 26.01.10 19:41 Сейчас в теме
(24) Вряд ли. В функции 1С строка постоянно режется и результат пишется в ту же переменную. Так не прокэшировать.

Но как вариант можно попробовать и случайный набор строк.
27. Душелов 4021 26.01.10 21:15 Сейчас в теме
(25) Все таки, думаю, при постоянном вычислении одних и тех же значений 1С-как кэширует.

И я ряд тестов провел, скорость примерно одинаковая, выше/ниже друг друга.

Согласен с (26) надо более сложный пример.
26. Evg-Lylyk 4894 26.01.10 20:26 Сейчас в теме
(24), (25) неудачный пример для сравнения получился (слишком простой) поэтому и не акцентировал на нем внимание.
На моей системе выдавал как у Душелова около 400 мс иногда с перевесом в пользу 1С.
Я уже давно сталкивался что 1С быстрее отрабатывает на простых вариантах, поэтому и писал про читаемость

Душелов; +1 Ответить
28. alexk-is 6544 26.01.10 21:30 Сейчас в теме
(26) (27) Я "ЗА" тестирование. Но у меня нет более сложного примера. Что вы имеете ввиду?

А функция в 1С могла бы выглядеть так:
Функция РазложитьСтрокуВМассивПодстрокБух16Корп20(Знач Стр, Разделитель = ",") Экспорт
	МассивСтрок = Новый Массив;
	ДлинаРазделителя = СтрДлина(Разделитель);
	Поз = Найти(Стр, Разделитель);
	Пока Поз <> 0 Цикл
		МассивСтрок.Добавить(Лев(Стр, Поз - 1));
		Стр = Сред(Стр, Поз + ДлинаРазделителя);
		Поз = Найти(Стр, Разделитель)
	КонецЦикла;
	МассивСтрок.Добавить(Стр);
	Возврат МассивСтрок
КонецФункции // глРазложить
Показать

Мне кажется вполне читаемо и работает быстрее. Возможно на более сложном примере будет иначе...
29. Душелов 4021 26.01.10 22:01 Сейчас в теме
(28) Берем к примеру любой анализ хтмл-кода, к примеру, выбрать весь текст, без тегов и т.п. Думаю, что "в ручном" режиме 1С это будет делать очень долго, именно в этом и есть прелесть регулярных выражений.
Или отобрать все е-мыл адреса в тексте.... Примеров найти можно много, но тут сложность будет в другом - написать аналогичные примеры на языке 1С.
30. Evg-Lylyk 4894 26.01.10 23:05 Сейчас в теме
(28) если честно я редко заморачиваюсь на счет скорости в абсолютном виде. Приемлемая вот то слово.
(29) согласен правильные примеры
Найти все GUIDы в тексте

Главная прелесть регуляров то что анализ описывается простым понятным языком.
Мое знакомство с RegExp началось когда мне нужно было разбирать файлы от дистрибьюторов вида:

<RCAgent {1},{Иванов}>
<SalesMen {1}, {ТП}, {1}>
...

причем была обработка, которая обрабатывала файлы, но она делала это очень медленно на файлы 30 Кб уходило по 5 минут. Понятно что она была написана не оптимально, но мне если честно трудно упрекать автора т.к. у меня от многих задач разбора текста "голова съезжала".
Переписал на RegExp оказалось просто и понятно и даже оптимизировать не пришлось разбор файлов по 100 Кб стал занимать 10 сек вместе с записью данных в СУБД. Было правда несколько ошибок, но это из за моего плохого знания языка шаблонов, да и ошибки исправлялись за 1 минуту.
35. artbear 1565 27.01.10 18:07 Сейчас в теме
(28) Приведенного кода из (34) достаточно для сравнения производительности и тестирования ? :)
31. Dementor 1041 27.01.10 10:32 Сейчас в теме
Очень хороший обзор. За примеры кода - отдельное спасибо.
На скоростях не замарачивайтесь - можеть и дольше чем на встроенном языке 1С, но зато понятность и скорость алгоритмизации процеса это компенсирует.
Evg-Lylyk; +1 Ответить
32. artbear 1565 27.01.10 15:58 Сейчас в теме
Да, хороший обзор.
Лично я бы код функций оформил по-другому:
1. простой общий модуль - в каждую функции передаем переменную RegExp как первый параметр
т.е. сначала создаем (кеширование), затем используем
в этом случае можно сделать проверку параметра в каждой функции - типа если параметр не заполнен, то создаем его по новой, если заполнен, пропускаем.

2. или создаем отдельную обработку-класс, в модуль которой и записываем весь указанный код, убираем из имен функций строку "РегулярныеВыражения_", добавляем к нужным функциям Экспорт.
и класс почти спокойно можно юзать.

Лично мне как приверженцу ООП нравится второй вариант :)

Ну и пример на самом деле хорошо бы поменять :)
33. artbear 1565 27.01.10 16:47 Сейчас в теме
РазложитьСтрокуВМассив и ПодставитьПараметрыВСтроку нужно изменить, т.к они могут работать неточно :)
например, в первый метод передадим в качестве разделителя точку, получим ошибки :)
во втором также могут быть проблемы - название функции не очень соответствует выполняемой функции
38. Evg-Lylyk 4894 27.01.10 20:39 Сейчас в теме
(33) с разделителем точка не будет проблем проверил шаблон "[^\.]*"
(34) спасибо теперь лучше ;)
(36) класс!!! будем знать самый быстрый вариант

Учел ценные предложения товарища artbear (обновил пример)
34. artbear 1565 27.01.10 17:03 Сейчас в теме
Насчет примера был неправ.
Даже в этом случае регулярные выражения немного, но выигрывают.
Проблема просто в неоптимальном/неаккуратном коде реализации метода РазложитьСтрокуВМассив :)
вместо вычисляющего цикла
Код
Для Сч = 0 По Matches.Count - 1 Цикл
      Массив.Добавить(Matches.Item(Сч).Value);
   КонецЦикла;
Показать полностью

нужно юзать простое
Код
Для каждого Item Из Matches Цикл
      Массив.Добавить(Item.Value);
   КонецЦикла;
Показать полностью

и результат налицо:
Выполнений: 1 000 функций на RegExp время: 2 516 мс
Выполнений: 1 000 Функции из Бух 1.6 и КОРП 2.0 время: 2 906 мс

для 100 функций - время одинаково :)

и это на очень простой задаче :) - а на сложных выигрыш будет намного больше

ЗЫ жаль, что код
Код
КОМ_Массив = Новый COMSafeArray(Matches);
   КОМ_Массив.Выгрузить(Массив);
Показать полностью

не работает, так было бы еще быстрее :)

PPS естественно, код функции РегулярныеВыражения_Выполнить также нужно изменить.
Evg-Lylyk; +1 Ответить
36. Душелов 4021 27.01.10 18:31 Сейчас в теме
(34) :)

А круче всех в этом сравнении:

Функция РазложитьСтрокуВМассивЯва(Строка, Разделитель = ",") Экспорт
	Массив = Script.eval("
	|var str=""" + Строка + """;
	|str.split(""" + Разделитель + """);");
	
	Возврат Массив;
КонецФункции
Evg-Lylyk; +1 1 Ответить
40. artbear 1565 28.01.10 07:45 Сейчас в теме
(36) Код на Яве не соответствует требованиям теста - возвращаемое значение не Массив 1С :)
нужно в ее конце вставить код
Код
   резМассив = Новый Массив;
   Для каждого Item Из Массив Цикл резМассив.Добавить(Item); КонецЦикла;
      
   Возврат резМассив;
Показать полностью

И результат по тесту из (39)
Выполнений: 1 000 Функции из Бух 1.6 и КОРП 2.0 время: 797 мс
Выполнений: 1 000 функций на RegExp время: 1 296 мс
Выполнений: 1 000 функций на Ява время: 2 063 мс

Счас посмотрю код 1С из (39)

ЗЫ лично я для проверки в конце модуля формы сразу вставляю юнит-тест, который и выдал мне ошибку для Явы :)
Код
   // -- Артур -- 28.01.2010
   артТесты.ПроверитьРавенство(АнализТекстаЗапроса_МАССИВ_ОПЕРАТОРОВ_1.Количество(), АнализТекстаЗапроса_МАССИВ_ОПЕРАТОРОВ_2.Количество(), "массивы операторов 1 и 2");
   артТесты.ПроверитьРавенство(АнализТекстаЗапроса_МАССИВ_ОПЕРАТОРОВ_1.Количество(), АнализТекстаЗапроса_МАССИВ_ОПЕРАТОРОВ_3.Количество(), "массивы операторов 1 и 3");
   
   артТесты.ПроверитьРавенство(АнализТекстаЗапроса_МАССИВ_ФУНКЦИЙ_1.Количество(), АнализТекстаЗапроса_МАССИВ_ФУНКЦИЙ_2.Количество(), "массивы функций 1 и 2");
   артТесты.ПроверитьРавенство(АнализТекстаЗапроса_МАССИВ_ФУНКЦИЙ_1.Количество(), АнализТекстаЗапроса_МАССИВ_ФУНКЦИЙ_3.Количество(), "массивы функций 1 и 3");
   // --завершение
Показать полностью


и сплю спокойно
37. Душелов 4021 27.01.10 18:39 Сейчас в теме
Выполнений: 100 Функции из Бух 1.6 и КОРП 2.0 время: 439 мс
Выполнений: 100 функций на RegExp время: 334 мс
Выполнений: 100 функций на яве время: 224 мс
39. alexk-is 6544 28.01.10 06:55 Сейчас в теме
1С интерпретатор. Больше строк кода - медленнее работает. Внес изменения в тест. Тест прилагается.

Выполнений: 1 000 Функции из Бух 1.6 и КОРП 2.0 время: 641 мс
Выполнений: 1 000 функций на RegExp время: 1 047 мс
Выполнений: 1 000 функций на Ява время: 843 мс

Нужно еще подумать... :)
Прикрепленные файлы:
Тест2.epf
41. artbear 1565 28.01.10 07:49 Сейчас в теме
ОФФ. По (39) мелкий коммент -
ИМХО очень неудачное структурирование кода в одну строку :(
читать очень трудно, почти невозможно :(
особенно метод РазложитьСтрокуВМассивПодстрокБух16Корп20
остальные-то более тривиальны.
43. alexk-is 6544 28.01.10 08:10 Сейчас в теме
(41) Структурированный код приведен в (28), а в тексте теста используется оптимизированный код. :)
В 1 строчку работает в 1.5-2 раза быстрее. О причинах я писал в (39) - 1С интерпретатор.
44. artbear 1565 28.01.10 08:53 Сейчас в теме
(43) Про скорость кода в 1 строку согласен
(42) (43)
Можно еще ускорить :)
1. в конце модуля добавляем
Код
резМассив = Новый Массив;
Script.AddObject("myarray", резМассив);
Показать полностью


2. исправляем метод РазложитьСтрокуВМассивЯва
на следующий
Код
Функция РазложитьСтрокуВМассивЯва(Строка, Разделитель = ",") Экспорт 
   резМассив.Очистить();
   резМассив = Script.eval("var str=""" + Строка + """; array1 = str.split(""" + Разделитель + """); for (i = 0; i < array1.length; i++) { myarray.Add(array1[i]); }; myarray; "); Возврат резМассив;
КонецФункции
Показать полностью


Получаем результат
Выполнений: 1 000 Функции из Бух 1.6 и КОРП 2.0 время: 735 мс
Выполнений: 1 000 функций на RegExp время: 1 859 мс
Выполнений: 1 000 функций на Ява время: 688 мс

счас переделаю код RegExp :)

PS юнит-тесты показывают, что код верный - возвращается правильный массив
kote; json; Душелов; +3 Ответить
45. Душелов 4021 28.01.10 09:21 Сейчас в теме
(44) Нормально!.. Можно еще поковырять :)
47. artbear 1565 28.01.10 09:31 Сейчас в теме
(45) На самом деле я немного смухлевал, конечно :)
Ведь в (44) на самом деле для Явы всегда возвращается один и тот же массив :( - а в остальных всегда вновь созданный.
К сожалению, у 1С нет метода копирования одного массива в другого или хотя бы конструирования массива по другому массиву.
А выгрузка/загрузка через списокЗначений или таблицуЗначений сильно тормозит :( (фактически время увеличивается в 2 раза)

Остается утешаться тем, что для более сложных задач RegExp поудобнее/помощнее/поудобнее :)
46. alexk-is 6544 28.01.10 09:29 Сейчас в теме
(44) Ошибочка :)

Выполнений: 1 000 Функции из Бух 1.6 и КОРП 2.0 время: 641 мс
Количество элементов: 151
Выполнений: 1 000 функций на RegExp время: 1 047 мс
Количество элементов: 151
Выполнений: 1 000 функций на Ява время: 797 мс
Количество элементов: 302 000
Прикрепленные файлы:
Тест2.epf
48. artbear 1565 28.01.10 09:32 Сейчас в теме
(46) Забыл дописать - естественно, в функции Ява нужно добавить резМассив.Очистить() :)

У меня юнит-тесты все равно такую ошибку бы не пропустили :)
49. artbear 1565 28.01.10 10:08 Сейчас в теме
(46) (45) Еще поковырял код :)
Выполнений: 1 000 Функции из Бух 1.6 и КОРП 2.0 время: 750 мс
Выполнений: 1 000 функций на RegExp время: 1 844 мс
Выполнений: 1 000 функций на Ява время: 344 мс

Вместо Явы, которая не возвращает чистый SafeArray, использую VBScript
в начале модуля
Код
Перем Script2;

Функция РазложитьСтрокуВМассивЯва(Строка, Разделитель = ",") Экспорт 
   Возврат Script2.eval("Split(""" + Строка + """, """ + Разделитель + """)").Выгрузить();
КонецФункции
Показать полностью

и в конце модуля
Код
Script2 = Новый COMОбъект("MSScriptControl.ScriptControl");
Script2.Language = "vbscript";
Показать полностью


ЗЫ код 1С также в 1 строчку.
Прикрепленные файлы:
Тест2.epf
50. Душелов 4021 28.01.10 10:17 Сейчас в теме
(49) Это не ява, это VBS :) добавляй в тест ;)
42. Душелов 4021 28.01.10 08:05 Сейчас в теме
Все таки примеры нужны другие :)
Типа тех, что я предложил ниже.
51. artbear 1565 28.01.10 11:51 Сейчас в теме
Итак, для простой задачи получения массива подстрок из строки по разделителю
получилось вот такое распределение
Выполнений: 1 000 Функции из Бух 1.6 и КОРП 2.0 время: 750 мс
Выполнений: 1 000 функций на RegExp время: 969 мс
Выполнений: 1 000 функций на VBScript время: 375 мс

Больше способа ускорить получение данных через RegExp не нашел.
Уже видно, что не такая большая разница между 1С и RegExp - даже для столь простой задачи.

Ну и ВБСкрипт выше всяких похвал :)

ЗЫ в последнем варианте реализации regExp загнал практически весь код в ВБСкрипт.
Прикрепленные файлы:
Тест2.epf
52. alexk-is 6544 28.01.10 12:09 Сейчас в теме
(51) Сделал более "читаемый" текст модуля на 1С. Вот результаты замеров.

Выполнений: 100 Функции из Бух 1.6 и КОРП 2.0 время: 47 мс
Выполнений: 100 функций на RegExp время: 78 мс
Выполнений: 100 функций на VBScript время: 47 мс

Выполнений: 1 000 Функции из Бух 1.6 и КОРП 2.0 время: 469 мс
Выполнений: 1 000 функций на RegExp время: 890 мс
Выполнений: 1 000 функций на VBScript время: 406 мс
Прикрепленные файлы:
Тест2.epf
53. Душелов 4021 28.01.10 12:25 Сейчас в теме
А вот альтернативные способы получить на 1С-е, не такие быстрые...

Строка = СтрЗаменить(Стр, Разделитель, Символы.ПС);
Для сч = 1 По СтрЧислоСтрок(Строка) Цикл
	МассивСтрок.Добавить(СтрПолучитьСтроку(Строка, сч));
КонецЦикла;


или, где Т = Новый ТекстовыйДокумент;

Строка = СтрЗаменить(Стр, Разделитель, Символы.ПС);	
Т.УстановитьТекст(Строка);
Для сч = 1 По Т.КоличествоСтрок() Цикл
	МассивСтрок.Добавить(Т.ПолучитьСтроку(сч));
КонецЦикла;
54. alexk-is 6544 28.01.10 12:53 Сейчас в теме
(53) Вот и я говорю об альтернативном коде и довольно быстром...
Возврат ЗначениеИзСтрокиВнутр("{""#"",51e7a0d2-530b-11d4-b98a-008048da3034,{0,{""S"",""" + СтрЗаменить(Стр, Разделитель, """},{""S"",""") + """}}}")
55. artbear 1565 28.01.10 13:30 Сейчас в теме
(54) Интересный вариант :)

А почему у тебя в (52) разница не такая большая ?
у меня на твоем тесте
Выполнений: 1 000 Функции из Бух 1.6 и КОРП 2.0 время: 625 мс
Выполнений: 1 000 функций на RegExp время: 1 000 мс
Выполнений: 1 000 функций на VBScript время: 407 мс

т.е. ЗначениеИзСтрокиВнутр и рядом с ВБ не стоит :)
56. alexk-is 6544 28.01.10 13:41 Сейчас в теме
(55) Наверное зависит от ПК, ОС и другого установленного ПО. У меня дома почему-то 1С немного медленее шевелится, хотя ПК почти одинаковые (дома RAID побольше :) ).
57. artbear 1565 28.01.10 13:49 Сейчас в теме
(56) Кстати, меня давно интересует вопрос - почему 1С функцию РазложитьСтрокуВМассив не реализует как встроенную/штатную.
Ведь у 1С на этой функции достаточно много построено :)

Кстати, твой код в (52) уже не имеет никакого отношения к Бух 1.6 и КОРП 2.0 :)
60. alexk-is 6544 28.01.10 14:18 Сейчас в теме
(57) Функция ЗначениеЗаполнено() появилась тоже сравнительно недавно. Может быть в 8.3 сделают. :)

В 7.7 у меня все построено на списках значений (динамических массивов нет) и используется приблизительно вот такой код:
СЗ = СоздатьОбъект("СписокЗначений");
СЗ.ИзСтрокиСРазделителями("""" + СтрЗаменить(ИсходнаяСтрока, Разделитель, """,""") + """");
Возврат СЗ;
Т.е. кое что по разбору строк в списки раньше было, но со временем об этом забыли...

Кстати, твой код в (52) уже не имеет никакого отношения к Бух 1.6 и КОРП 2.0
Ну, я тоже к этому не имею непосредственного отношения :)
61. artbear 1565 28.01.10 15:38 Сейчас в теме
(60) это уже ОФФ :)
В 77 нужно хотя бы просто загружать ВК 1С++ - создание объектов будет супербыстрым, в штатной 1С оно очень-очень медленно.
Лично проверял и делал код в 1С++ :)
58. Душелов 4021 28.01.10 14:07 Сейчас в теме
Я думаю, что надо заводить отдельную ветку с поисками и оптимизацией алгоритмов штатных, 1С-ных универсальных методов.
Evg-Lylyk; artbear; +2 Ответить
59. artbear 1565 28.01.10 14:14 Сейчас в теме
(58) Хорошая идея.
Завел новую ветку
http://infostart.ru/public/64770/
Evg-Lylyk; +1 Ответить
62. alexk-is 6544 31.01.10 13:03 Сейчас в теме
(0) Предполагаю, что в п. 6. Заключение есть ссылка на меня. Можно поправить ник или это так задумано?
63. Evg-Lylyk 4894 31.01.10 13:06 Сейчас в теме
64. TUTSIC9 21.09.11 12:46 Сейчас в теме
Суперски!!! Регулярные выражения очень помогаюТ!!! не Хочется каждый раз писать одно и тоже )
Evg-Lylyk; +1 Ответить
65. CaSH_2004 373 28.10.11 22:20 Сейчас в теме
Автор - СПАСИБО за подробное изложение!
66. bar_s 20.11.11 16:25 Сейчас в теме
Выполнений: 100 Функции из Бух 1.6 и КОРП 2.0 время: 47 мс
Выполнений: 100 функций на RegExp время: 78 мс
Выполнений: 100 функций на VBScript время: 47 мс

Выполнений: 1 000 Функции из Бух 1.6 и КОРП 2.0 время: 469 мс
Выполнений: 1 000 функций на RegExp время: 890 мс
Выполнений: 1 000 функций на VBScript время: 406 мс
67. fixin 4277 12.12.11 11:08 Сейчас в теме
хорошая статья, жаль нет примеров, как заменить одну строку на другую, но буду копать.

Может быть на РегЭксп так долго, потому что каждый раз объект создаете? Попробуйте его один раз создавать.

Ссылка http://www.script-coding.info/WSH/RegExp.html битая...
Вместо нее рекомендую: http://www.script-coding.com/WSH/RegExp.html#3.1.
68. ADirks 187 12.04.13 10:27 Сейчас в теме
С фразы: "основное достоинство RegExp это читаемость"
чуть со стула не упал :)
например, чё за? '^\\s*((?:(?:(?:"[^"]")*)|(?:[^/]*)|(?:[^/]+/))*)(//.*)?\\s*$'
и это ведь достаточно примитивный RegExp

Ну и за [([\wА-яёЁ]+)\] хочется кого-то придушить. Почему в Perl'е я могу просто написать \w, а в родном виндовом движке - фигушки??!!!
69. Evg-Lylyk 4894 12.04.13 18:16 Сейчас в теме
(68) Читаемость относительная. Код еще сложнее. Ну естественно при условии хороших знаний регуляров
70. ADirks 187 12.04.13 18:36 Сейчас в теме
(69) Основной прикол регэкспов в том, что написать иной раз проще, чем понять :)
axelerleo; kote; +2 Ответить
77. andrewks 1375 01.01.14 23:02 Сейчас в теме
(70)

Some people, when confronted with a problem, think
“I know, I'll use regular expressions.” Now they have two problems.
©
71. Tedman 14.11.13 10:37 Сейчас в теме
Если я всё правильно понимаю, то можно и не спрашивать будет ли конструкция
Новый COMОбъект("VBScript.RegExp");

у меня работать, если сервер 1С располагается на Linux?
72. Evg-Lylyk 4894 14.11.13 10:47 Сейчас в теме
(71) Ну да не будет
Там наверно есть другие библиотеки, но подсказать ничего не могу.
73. Tedman 14.11.13 11:18 Сейчас в теме
(72) Ну да, там есть штатные консольные средства мощные. Ясненько... просто решил уточнить. Спасибо.
74. Jon2011 80 29.11.13 11:03 Сейчас в теме
Всем привет! Есть обработка по поиску картинок в интернете: http://infostart.ru/public/82682/
в ней как раз основная фишка поиск через регулярное выражение.
Алгоритм простой: из Гугля или Яндекса получаем список картинок и анализируем при помощи регулярного выражения
мRegExp.Pattern = "imgres\?imgurl=(.*?)&imgrefurl=(.*?)&usg.*?&h=(.*?)&w=(.*?)&sz=(.*?)&.*?;tbnid=(.*?):";

Если Matches.Count больше нуля - все ОК.
Все работало хорошо до последнего времени, что сломалось не пойму.
Гугл картинки собирает, а скрипт ничего найти не может. Может кто знает в чем проблема?

P.S. Автор разработки отмалчивается.
75. d_vit 27 04.12.13 11:15 Сейчас в теме
(74)Присоединяюсь.
Помогите пожалуйста с решением данной проблемы.
76. GreenLab 86 01.01.14 21:23 Сейчас в теме
У кого-нибудь работает под 8.3.4. ?
При подключении компоненты под 8.3.4.389 падает платформа.
78. andrewks 1375 01.01.14 23:05 Сейчас в теме
79. GreenLab 86 02.01.14 09:35 Сейчас в теме
(78) andrewks, О сорри, не в ту публикацию написал. Падает под 8.3.4 именно компонента от Орефкова


80. LOleg 03.03.16 12:28 Сейчас в теме
вот это да, это же джаваскрипт в 1С :)
Оставьте свое сообщение