Конфигурация «Каталог файлов» с полнотекстовым поиском по содержимому

Публикация № 175908

Администрирование - Администрирование данных 1С - Поиск данных

Возможности программы позволяют создавать каталог и осуществлять полнотекстовый поиск по любым типам файлов, которые умеет индексировать операционная система(txt, doc, pdf, html, медиафайлы, архивы и многие другие). Кроме того, дополнительно можно расширить эту функцию с помощью соответствующего внешнего консольного приложения.

1С:Предприятие не имеет возможности осуществлять полнотекстовый поиск по текстам из внешних файлов, а только по информации, содержащейся внутри объектов своей системы. Чтобы такая возможность появилась были проведены описанные ниже работы.

В конфигурации был добавлен справочник «Файлы», для которого был добавлен реквизит «ТекстФайла» В этот реквизит при добавлении файла в программу автоматически или вручную, загружается текст файла, очищенный от всего лишнего – тегов оформления, картинок и т.п. И уже по этому реквизиту будет осуществляться полнотекстовый поиск.

Для извлечения текста из файлов используется интерфейс IFilter. Он является расширяемым. Можно установить дополнительные модули, чтобы появилась возможность извлекать текст из еще одного типа файлов. По умолчанию текст извлекается из файлов следующих типов (имеющих расширение): ASCX, ASP, ASPX, CSS, HHC, HTA, HTM, HTML, HHT, HTW, HTX, ODC, STM, DOC, DOT, POT, PPS, PPT, XLB, XLC, XLS, XLT, TXT, EML. Подразумевается, что файлы с расширением TXT — это текстовые файлы в кодировке ANSI или UNICODE (UTF-16).

Плагины IFilter позволяют службе индексирования Windows(и Windows Desktop Search) индексировать различные форматы так, чтобы они стали доступными для поиска. Без соответствующего IFilter, содержимое файла не может быть прочитано и проиндексировано поисковой системой. IFilters также используются SQL Server в качестве компонента SQL Server Full Text Search.

Для работы программы с форматом PDF необходимо установить расширение PDF IFilter, с CHM — расширение CHM IFilter.

Чтобы узнать, какие расширения для IFilter уже установлены на вашем компьютере, можно скачать и установить программу IFilter Explorer.

То есть возможности программы позволяют создавать каталог и осуществлять полнотекстовый поиск по любым типам файлов, которые умеет индексировать операционная система. В этом списке присутствуют даже архивы. Это без учета того, что можно расширить эту функцию с помощью внешнего приложения.

В конфигурации используются (большое спасибо авторам):

//infostart.ru/public/121926/

//infostart.ru/public/105063/

Ссылка на страничку автора с более подробным описанием: Конфигурация «Каталог файлов» с полнотекстовым поиском

Скачать файлы

Наименование Файл Версия Размер
конфа

.rar 2,87Mb
60
.rar 2,87Mb 60 Скачать

Специальные предложения

Оставьте свое сообщение

См. также

TextRadar - нечеткий поиск в тексте Промо

Разработка внешних компонент Поиск данных v8 1cv8.cf Абонемент ($m)

В отличие от нечеткого сравнения строк, когда обе сравниваемых строки равнозначны, в задаче нечеткого поиска выделяются строка поиска и строка данных, а вычислить необходимо не степень похожести двух строк, а степень присутствия строки поиска в строке данных. Нормированный коэффициент, находящийся между 0 и 1 позволяет отсечь заведомо низкие результаты, организовать поиск по синонимам и т.д. Наглядное отображение результатов в кратком и детальном виде поможет быстро найти интересующий фрагмент.

1 стартмани

19.09.2018    19208    30    TSSV    19    

Универсальный подбор и обработка объектов, перенумерация с возможностью установить длину номера

Универсальные обработки Обработка документов Обработка справочников v8 УТ10 Абонемент ($m)

Универсальный подбор и обработка объектов, доработал немного перенумерацию документов и справочников.

1 стартмани

23.03.2012    9842    146    andreyshim    3    

Обработка поиска данных в информационной базе.

Поиск данных v8 1cv8.cf Россия Абонемент ($m)

Обработка поиска данных в информационной базе. Можно рассматривать как пример использования механизма «Полнотекстового поиска».

1 стартмани

19.01.2012    11377    42    Ягг    1