Очистка HTML от лишних тегов

Программирование - Практика программирования

Очистка HTML от "лишних" тегов, которые генерирует WORD

Столкнулся с проблемой при выгрузке на свой сайт статей из 1с

что WORD сохраняет тексты в HTML с "мусором"

пришлось написать обработку, которая этот мусор удаляет их HTML, обработка простая - вставили HTML, который сделали из ворда, и нажали очистить

Скачать файлы

Наименование Файл Версия Размер
Очистка HTML от лишних тегов
.epf 7,29Kb
17.08.12
39
.epf 7,29Kb 39 Скачать

См. также

Комментарии
1. Александр Перевислый (sashapere) 142 15.08.12 16:16 Сейчас в теме
Спасибо, как раз такая обработка давно нужна.
2. Данила Елистратов (CagoBHuK) 27 15.08.12 17:23 Сейчас в теме
(1) Учите регулярные выражения.
3. Михаил Кащенко (Visitizer) 152 21.08.12 17:30 Сейчас в теме
(2) CagoBHuK, Что конкретно вы имели ввиду?
4. Данила Елистратов (CagoBHuK) 27 21.08.12 17:36 Сейчас в теме
5. Михаил Кащенко (Visitizer) 152 21.08.12 17:43 Сейчас в теме
(4) CagoBHuK, И что, есть примерчик посмотреть решение в 1с
как по мне, то регулярные выражения будут более запутанным решением
6. Данила Елистратов (CagoBHuK) 27 22.08.12 09:44 Сейчас в теме
(5) Ничего запутанного. Регулярные выражения реализованы в любом более-менее нормальном языке программирования. Если их до сих пор не реализовала 1С, это не значит, что они запутаны. Это, скорее, камень в огород 1С.
7. Григорий Кожемякин (globalteddi) 12.09.12 20:33 Сейчас в теме
(6) CagoBHuK, Смысла реализовывать в 1С нет, регулярные выражения легко подключаются:

RegExp=Новый COMОбъект("VBScript.RegExp");
8. Данила Елистратов (CagoBHuK) 27 12.09.12 21:10 Сейчас в теме
(7) Мне интересно, как Вы это заведете на линукс-сервере. Еще мне интересно, как оно будет работать с кириллицей.
9. Михаил Кащенко (Visitizer) 152 13.09.12 10:56 Сейчас в теме
И все-равно я считаю что разработка аналогичной задачи на регулярных выражениях займет больше времени
Оставьте свое сообщение