gifts2017

Удаление HTML тегов и спецсимволов с использованием RegExp (регулярных выражений)

Опубликовал Сергей Чигирь (Kserken) в раздел Программирование - Инструментарий

Удаляем из файла HTML - теги и спецсимволы, оставляем только текст.

Регулярные выражения (Regular Expressions) являются известным и мощным средством для поиска, тестирования и замены подстрок. Эта технология доступна и в 1С - через объект VBScript.RegExp. Нужный объект уже встроен в современные версии Windows (начиная с Windows 98), и устанавливать дополнительно ничего не нужно.

В данном примере, собственно, и рассматривается пример удаления HTML тегов и спецсимволов с помощью RegExp.

Таблицу спецсимволов HTML можно посмотреть здесь: http://htmlweb.ru/html/symbols.php

Скачать файлы

Наименование Файл Версия Размер Кол. Скачив.
УдалениеHTMLТегов(толстый_клиент).epf
.epf 6,93Kb
29.08.12
52
.epf 6,93Kb 52 Скачать
УдалениеHTMLТегов(тонкий_клиент).epf
.epf 6,60Kb
29.08.12
22
.epf 6,60Kb 22 Скачать

См. также

Подписаться Добавить вознаграждение

Комментарии

1. Сергей Ожерельев (Поручик) 29.08.12 12:22
(0) Двиг сайта преобразовал HTML-коды
2. kserken (Kserken) 29.08.12 12:32
(1) Поручик, поясните, что вы имели в виду?
3. Сергей Ожерельев (Поручик) 29.08.12 12:41
(2) В таблице символы и HTML-коды одинаковые
4. kserken (Kserken) 29.08.12 12:53
(3) Поручик, да действительно. Спасибо, что заметили. Вечером поменяю. Вот спецсимволы, которые я имел ввиду http://htmlweb.ru/html/symbols.php
5. Яков Коган (Yashazz) 29.08.12 15:40
Баян. Скоро уже "СтрЗаменить" будем как отдельную публикацию оформлять...
6. kserken (Kserken) 29.08.12 16:38
(5) Yashazz, по-первых - не баян, т.к. на сайте примера удаления тегов и спецсимволов с помощью регулярных выражений нет, а во-вторых для новичков будет полезно разобрать более удобные способы поиска и замены значений в тексте, чем СтрЗаменить().
7. Сергей Ожерельев (Поручик) 31.10.12 13:40
8. алексей (Alex141516) 06.05.15 18:24
искал тоже как получить чистый текст из HTML, не совсем в тему может - нашел на мисте - Текст = ЭлементыФормы.ПолеHTMLдокумента.Документ.documentElement.innerText
Для написания сообщения необходимо авторизоваться
Прикрепить файл
Дополнительные параметры ответа