gifts2017

Очистка HTML от лишних тегов

Опубликовал Михаил Кащенко (Visitizer) в раздел Программирование - Практика программирования

Очистка HTML от "лишних" тегов, которые генерирует WORD

Столкнулся с проблемой при выгрузке на свой сайт статей из 1с

что WORD сохраняет тексты в HTML с "мусором"

пришлось написать обработку, которая этот мусор удаляет их HTML, обработка простая - вставили HTML, который сделали из ворда, и нажали очистить

Скачать файлы

Наименование Файл Версия Размер
Очистка HTML от лишних тегов 37
.epf 7,29Kb
17.08.12
37
.epf 7,29Kb Скачать

См. также

Подписаться Добавить вознаграждение
Комментарии
1. Александр Перевислый (sashapere) 15.08.12 16:16
Спасибо, как раз такая обработка давно нужна.
2. Данила Елистратов (CagoBHuK) 15.08.12 17:23
(1) Учите регулярные выражения.
3. Михаил Кащенко (Visitizer) 21.08.12 17:30
(2) CagoBHuK, Что конкретно вы имели ввиду?
4. Данила Елистратов (CagoBHuK) 21.08.12 17:36
5. Михаил Кащенко (Visitizer) 21.08.12 17:43
(4) CagoBHuK, И что, есть примерчик посмотреть решение в 1с
как по мне, то регулярные выражения будут более запутанным решением
6. Данила Елистратов (CagoBHuK) 22.08.12 09:44
(5) Ничего запутанного. Регулярные выражения реализованы в любом более-менее нормальном языке программирования. Если их до сих пор не реализовала 1С, это не значит, что они запутаны. Это, скорее, камень в огород 1С.
7. Григорий Кожемякин (globalteddi) 12.09.12 20:33
(6) CagoBHuK, Смысла реализовывать в 1С нет, регулярные выражения легко подключаются:

RegExp=Новый COMОбъект("VBScript.RegExp");
8. Данила Елистратов (CagoBHuK) 12.09.12 21:10
(7) Мне интересно, как Вы это заведете на линукс-сервере. Еще мне интересно, как оно будет работать с кириллицей.
9. Михаил Кащенко (Visitizer) 13.09.12 10:56
И все-равно я считаю что разработка аналогичной задачи на регулярных выражениях займет больше времени