gifts2017

Распознование PDF файлов

Опубликовал Rauan Sandybaev (sandybaev) в раздел Обработки - Универсальные обработки

Обработка распознавания файлов в формате PDF.
К сожалению в 1С нет возможности распознавать сканированные файлы. Поработав в сети я наткнулся на некоторые файлы. Которые после некоторых изменений превратились вот в эту обработку. 



Вкратце что необходимо знать:

Обработка корректно может распознать только те файлы которые были пересохранены с Word-a или Excel-я в файл с расширением PDF.
В остальных случаях за чистоту результата не ручаюсь.


Немного как появилась необходимость в написании такой обработки.
 1. У меня на работе Есть 1С сервер установленный на Windows (его обслуживают админы их много);
 2. На всех клиентских машинах 1С подключена через RDP (со всеми вытекающими плюсами и минусами);
 3. В тех задании стояла задача загружать произвольную информацию сохраненных в семействе продуктов Office.

файлы Word и Excel загружаться не будут т.к.
Админ мотивировал отказ тем что, по правилам должно докупаться лицензия на каждую терминальную сессию, а это дорого и не рационально.
Пришлось идти в гугл и вот результат. Нашел бесплатные библиотеки, женил с 1с и получилась вот такая вот вещь.

Вот пример кода:

ФайлPDF = ДиалогОткрытияФайла.ПолноеИмяФайла;
КаталогВременныхФайлов = КаталогВременныхФайлов();
МакетУтилиты = ПолучитьМакет("pdftotext");
Адрес = ПоместитьВоВременноеХранилище(МакетУтилиты, Новый УникальныйИдентификатор);
ФайлУтилиты1 = КаталогВременныхФайлов + "pdftotext.exe";
ДанныеХранилища = ПолучитьИзВременногоХранилища(Адрес);
УдалитьИзВременногоХранилища(Адрес);
ДанныеХранилища.Записать(ФайлУтилиты1);
МакетУтилиты = ПолучитьМакет("hstart");
Адрес = ПоместитьВоВременноеХранилище(МакетУтилиты, Новый УникальныйИдентификатор);
ФайлУтилиты2 = КаталогВременныхФайлов + "hstart.exe";
ДанныеХранилища = ПолучитьИзВременногоХранилища(Адрес);
УдалитьИзВременногоХранилища(Адрес);
ДанныеХранилища.Записать(ФайлУтилиты2);

p.s. Коды все открыты. можете поковыряться

Скачать файлы

Наименование Файл Версия Размер
Обработка по работе с PDF файлом 25
.epf 430,72Kb
11.09.14
25
.epf 430,72Kb Скачать

См. также

PowerTools от 1 000
Подписаться Добавить вознаграждение
Комментарии
1. Rauan Sandybaev (sandybaev) 12.09.14 06:55
Буду рад обсудить материал.
2. Яков Коган (Yashazz) 15.09.14 15:25
РаспознАвание. От слова "знать".
3. Rauan Sandybaev (sandybaev) 15.09.14 12:47
Сорри, Yashazz. главное код внутри пашет.
4. г. Казань Рустем Гумеров (Rustig) 17.09.14 00:39
(0) работает на 8.2, Вин7 х64 - проверено!
5. Rauan Sandybaev (sandybaev) 17.09.14 05:06
Да должно работать т.к. внешние компоненты запускаются через Winshell команды.
6. Fomix (fomix) 25.09.14 12:03
Картинки в тексте распознает?
7. Rauan Sandybaev (sandybaev) 25.09.14 13:51
(6) fomix, К сожалению нет. Он очень хорошо отрабатывает все что сохранено из Ecxel то бишь таблицы, списки, графики. А вот картинки не-е.