Чтение примечаний из файла с расширением «docx» без применения COM-объекта

28.02.24

Разработка - Универсальные функции

Добрый день, задачка возникла при внедрении 1С «Документооборот 3.0». Заказчику потребовалось реализовать чтение примечаний из прикрепленного к согласованию Word файла и помещение его в результат согласования при исполнении задачи «Согласовать».

Перед этим, в базе «Документооборот 3.0» был поставлен запрет на загрузку файлов с расширением «doc», так как для его чтения требуется COM объект, что для нас было недопустимо, ну и «doc» устарел слегка.

По заветам профессионалов платформы – «решил задачку, поделись решением» - выкладываю алгоритм, вдруг кому пригодится:

Не секрет, что есть у файла с расширением «docx», поменять это самое расширение на «zip», то мы получим архив с файлами «xml». Так вот примечания хранятся в отдельном файле «comments.xml».
 

//Конвертирует в zip документ docx и читает файл comments.xml из разархивированной папки
//
// Параметры:
//  ДвоичныеДанныеФайла	 - Двоичные данные - Двоичные данные файла Word, который необходимо прочитать
// 
// Возвращаемое значение:
// Строка - Все примечания, которые есть в документе строкой 
//
Функция ИнициализироватьXMLИзDocx(ДвоичныеДанныеФайла)
	
	ПутьКФайлу = ПолучитьИмяВременногоФайла("docx");
	ДвоичныеДанныеФайла.Записать(ПутьКФайлу);
	
	КопироватьФайл(ПутьКФайлу, СтрЗаменить(ПутьКФайлу, "docx", "zip"));
	ИмяФайлаСПутемZIP = СтрЗаменить(ПутьКФайлу, "docx", "zip");
	
	ВременнаяПапкаДляРазархивирования = ПолучитьИмяВременногоФайла("");
	
	Архив = Новый ЧтениеZipФайла();
	Архив.Открыть(ИмяФайлаСПутемZIP);
	Архив.ИзвлечьВсе(ВременнаяПапкаДляРазархивирования, РежимВосстановленияПутейФайловZIP.Восстанавливать);
	Архив.Закрыть(); 
	
	//В этом отдельном файле хранятся примечания скопом
	Файл = Новый Файл(ВременнаяПапкаДляРазархивирования + "/word/comments.xml");
	
	СтрокаПримечания = "";	
	Если Файл.Существует() Тогда		
		СтрокаПримечания = XMLComments(ВременнаяПапкаДляРазархивирования + "/word/comments.xml");		
	КонецЕсли;
			
	УдалитьФайлы(ВременнаяПапкаДляРазархивирования);
	УдалитьФайлы(ПутьКФайлу);
	УдалитьФайлы(ИмяФайлаСПутемZIP);
	
	Возврат СтрокаПримечания;
	
КонецФункции

Функция поиска по тегам "XMLComments":
 


//Ищет теги примечания и берет текстовое значение в указанном файле.Учитываются комментарии только начинающиеся со знака "#"
//
// Параметры:
//  ПутьКФайлу	 - 	Строка  - Путь к xml файлу, который нужно прочитать
// 
// Возвращаемое значение:
// Строка  - прочитанные значения (текст примечаний через перенос строки)
//
Функция XMLComments(ПутьКФайлу)
	
	Файл = Новый ЧтениеXML;
	Файл.ОткрытьФайл(ПутьКФайлу);
	
	МассивПримечания = Новый Массив;
	
	НачалсяКомментарий = Ложь;
	Пока Файл.Прочитать() Цикл			
		Если Файл.ТипУзла = ТипУзлаXML.НачалоЭлемента И Файл.Имя="w:comment" Тогда
			НачалсяКомментарий = Истина;
			СтрокаПримечаний = "";
			Продолжить;
		КонецЕсли;
		
		Если НачалсяКомментарий И Файл.ТипУзла = ТипУзлаXML.Текст Тогда
			СтрокаПримечаний = СтрокаПримечаний + Файл.Значение;
		КонецЕсли;
		
		Если Файл.ТипУзла = ТипУзлаXML.КонецЭлемента И Файл.Имя="w:comment" Тогда
			НачалсяКомментарий = Ложь;
			МассивПримечания.Добавить(СтрокаПримечаний);
		КонецЕсли;		
	КонецЦикла;
	
	Файл.Закрыть();
	
	Возврат СтрСоединить(МассивПримечания, Символы.ПС + Символы.ПС);
	
КонецФункции

М.б. кому-нибудь будет полезно. 

Если подобные темы работы с файлами Вам интересны, то могу выложить код вставки штрихкода в документ "pdf" и "docx" автоматом после согласования. При этом "docx" блокируется на редактирование паролем.

Чтение Word без Com docx Документооборот Чтение файла Без Com xml Документооборот 3.0.

См. также

Универсальные функции Программист Платформа 1С v8.3 Конфигурации 1cv8 Бесплатно (free)

Благодаря этим пяти строчкам можно больше не заморачиваться с загрузкой из внешних файлов. Пользуюсь везде, всегда и постоянно.

21.05.2024    23928    dimanich70    81    

147

Универсальные функции Программист Платформа 1С v8.3 Конфигурации 1cv8 Абонемент ($m)

Задача: вставить картинку из буфера обмена на форму средствами платформы 1С.

1 стартмани

18.03.2024    4410    3    John_d    11    

57

Универсальные функции Программист Стажер Платформа 1С v8.3 Конфигурации 1cv8 Бесплатно (free)

Пришлось помучиться с GUID-ами немного, решил поделиться опытом, мало ли кому пригодится.

12.02.2024    23567    atdonya    25    

58

Универсальные функции Программист Платформа 1С v8.3 Бесплатно (free)

На заключительных этапах, когда идет отладка или доработка интерфейса, необходимо много раз переоткрыть внешний объект. Вот один из способов автоматизации этого.

30.11.2023    5937    ke.92@mail.ru    17    

65

WEB-интеграция Универсальные функции Механизмы платформы 1С Программист Платформа 1С v8.3 Конфигурации 1cv8 Бесплатно (free)

При работе с интеграциями рано или поздно придется столкнуться с получением JSON файлов. И, конечно же, жизнь заставит проверять файлы перед тем, как записывать данные в БД.

28.08.2023    16135    YA_418728146    8    

170

Пакетная печать Печатные формы Адаптация типовых решений Универсальные функции Платформа 1С v8.3 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х Россия Абонемент ($m)

Расширение для программ 1С:Управление торговлей, 1С:Комплексная автоматизация, 1С:ERP, которое позволяет распечатывать печатные формы для непроведенных документов. Можно настроить, каким пользователям, какие конкретные формы документов разрешено печатать без проведения документа.

2 стартмани

22.08.2023    4042    66    progmaster    9    

4

Инструментарий разработчика Универсальные функции Платформа 1С v8.3 Конфигурации 1cv8 1С:Розница 2 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х 1С:Зарплата и Управление Персоналом 3.x Абонемент ($m)

Копирует в буфер значения из списков, из ячеек отчетов, таблиц, настроек списков, других отборов и вставляет в выбранную настройку отбора. Работает с Объект не найден. Работает как в одной так и между разными базами 1С. Использует комбинации [Alt+C] Копировать список, [Alt+V] Вставить список. Также для копирования данных используется стандартная [Ctrl+C] (например из открытого xls, mxl, doc и т.п. файла скопировать список наименований)

1 стартмани

13.10.2022    18983    176    sapervodichka    112    

136
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. user1898897 29.02.24 09:26 Сейчас в теме
Интересная тема. Также любопытна реализация вставки штрихкода в документ, делал аналогичную вещь, хочется посмотреть и на ваше решение.
2. Luis-Gomer 56 01.03.24 11:50 Сейчас в теме
(1) Спасибо за отзыв, за выходные составлю - выложу.
3. MrShvets 23.05.24 07:49 Сейчас в теме
(2) Тоже интересно посмотреть на приемы работы с pdf.
4. NikVeega 06.08.24 10:12 Сейчас в теме
Публикация классная, с учетом того, что мало где написано про работу с docx без word. А на какой текст или строку ссылается примечание удается получить?? потому что просто примечания не всегда информативно, без указания места!
5. Sindbad_M 100 19.11.24 12:08 Сейчас в теме
(4)
Точку в тексте документа, к которой относится примечание, получить не сложно. У элемента w:comment есть атрибут w:id - уникальный в пределах документа идентификатор комментария.

Можно просмотреть файл document.xml, в нем будут элементы w:commentReference с атрибутом w:id, для каждого комментария свой элемент w:commentReference. Если комментарий соответствует какой-то области текста, то в document.xml помимо элемента w:commentReference также будут элементы w:commentRangeStart и w:commentRangeEnd, соответствующие началу и концу текстовой области.
Оставьте свое сообщение