Столкнулся с проблемой при выгрузке на свой сайт статей из 1с
что WORD сохраняет тексты в HTML с "мусором"
пришлось написать обработку, которая этот мусор удаляет их HTML, обработка простая - вставили HTML, который сделали из ворда, и нажали очистить