strmatch - Нечеткое сравнение и поиск строк

25.03.15

Разработка - Инструментарий разработчика

Компонента для нечеткого сравнения строк.
Это репост моей публикации из "Клуба профессионалов 1С"

Скачать файл

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование По подписке [?] Купить один файл
Архив с компонентой и описанием
.zip 38,30Kb ver:2.1.0
255
255 Скачать (1 SM) Купить за 1 850 руб.

Компонента для нечеткого сравнения строк. Служит для поиска наиболее похожей на образец строки из списка.
Сравнение производится по звучанию, поэтому возможно сопоставление названий на русском и английском языках между собой.

 

Т.к. на базе этой компоненты существуют разработки, предлагаемые на инфостарте, я решил разместить и саму компоненту также тут. Автор я сам, никакого плагиата :)

Важное замечание 1. Значения, выдаваемые компонентой, это НЕ ПРОЦЕНТЫ (!!!).
Сами по себе цифры ничего не значат, показательно то, что для более похожих строк они больше. Основной use case использования: взять строку-образец, сравнить по очереди со списком строк для поиска наиболее похожих. Для ускорения многократного сравнения разных образцов с одним и тем же набором строк предусмотрен механизм создания внутренних кешей.

Важное замечание 2. Компонента не может ответить на вопрос: "Есть искомая строка среди списка или нет". Она только выберет строки из предложенного списка наиболее похожие на образец. Если результат показался странным, значит остальные строки, по мнению внутреннего алгоритма, похожи на образец не более, чем выбранные.

 В комплекте идет:

  • bildlist.txt - история версий
  • FuzSearch.ert - пример использования
  • readme.txt - описание и информация о том как подключить
  • StrMatch.als - файл синтаксис-помошника по компоненте
  • StrMatch.dll - сама компонента. Версия 2.1.0 от 4 февраля 2005г.

Для работы требуется:

    Проверить, есть ли в папке system32 файлы:
    mfc71.dll и msvcr71.dll - если нет, то найти в инете и поместить их туда

 

Какая-либо работа над компонентой прекращена и не планируется в обозримом будущем. Найденные исходники выложены сюда:

https://github.com/5k0rp/StrMatch

Возможно, исходники не самые свежие, т.к. в какой-то момент они терялись из-за умершего диска. Как и что удалось восстановить - не помню.

strmatch нечеткое сравнение поиск fuzzy fuzzysearch

См. также

SALE! 15%

Инструментарий разработчика Роли и права Запросы СКД Программист Платформа 1С v8.3 Управляемые формы Запросы Система компоновки данных Конфигурации 1cv8 Платные (руб)

Набор инструментов программиста и специалиста 1С для всех конфигураций на управляемых формах. В состав входят инструменты: Консоль запросов, Консоль СКД, Консоль кода, Редактор объекта, Анализ прав доступа, Метаданные, Поиск ссылок, Сравнение объектов, Все функции, Подписки на события и др. Редактор запросов и кода с раскраской и контекстной подсказкой. Доработанный конструктор запросов тонкого клиента. Продукт хорошо оптимизирован и обладает самым широким функционалом среди всех инструментов, представленных на рынке.

10000 руб.

02.09.2020    159622    874    399    

862

SALE! 15%

Инструментарий разработчика Чистка данных Свертка базы Инструменты администратора БД Системный администратор Программист Руководитель проекта Платформа 1С v8.3 Конфигурации 1cv8 1С:Управление торговлей 10 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 Россия Платные (руб)

Инструмент представляет собой обработку для проведения свёртки или обрезки баз данных. Работает на ЛЮБЫХ конфигурациях (УТ, БП, ERP и т.д.). Поддерживаются управляемые и обычные формы. Может выполнять свертку сразу нескольких баз данных и выполнять их автоматически без непосредственного участия пользователя.

8400 7140 руб.

20.08.2024    7841    57    23    

69

Инструментарий разработчика Программист Платформа 1С v8.3 Конфигурации 1cv8 Платные (руб)

Инструмент для написания и отладки кода в режиме «1С:Предприятие». Представляет собой консоль кода с возможностью пошаговой отладки, просмотра значений переменных любых типов, использования процедур и функций, просмотра стека вызовов, вычисления произвольных выражений на встроенном языке в контексте точки останова, синтаксического контроля и остановки по ошибке. В консоли используется удобный редактор кода с подсветкой, контекстной подсказкой, возможностью вызова конструкторов запроса и форматной строки.

9360 руб.

17.05.2024    23481    68    45    

117

SALE! 15%

Инструменты администратора БД Инструментарий разработчика Роли и права Программист Платформа 1С v8.3 Конфигурации 1cv8 Россия Платные (руб)

Расширение позволяет без изменения кода конфигурации выполнять проверки при вводе данных, скрывать от пользователя недоступные ему данные, выполнять код в обработчиках. Не изменяет данные конфигурации, легко устанавливается практически на любую конфигурацию на управляемых формах.

10000 8500 руб.

10.11.2023    10455    36    25    

61

SALE! 15%

Пакетная печать Печатные формы Инструментарий разработчика Программист Платформа 1С v8.3 Запросы 1С:Зарплата и кадры бюджетного учреждения 1С:Конвертация данных 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 Платные (руб)

Инструмент, позволяющий абсолютно по-новому взглянуть на процесс разработки печатных форм. Благодаря конструктору можно значительно снизить затраты времени на разработку печатных форм, повысить качество и "прозрачность" разработки, а также навести порядок в многообразии корпоративных печатных форм.

22200 19980 руб.

06.10.2023    15419    35    7    

70

SALE! 35%

Инструментарий разработчика Инструменты администратора БД Системный администратор Программист Платформа 1С v8.3 Управляемые формы Конфигурации 1cv8 Россия Платные (руб)

Универсальный инструмент программиста для администрирования конфигураций. Сборник наиболее часто используемых обработок под единым интерфейсом.

4800 3120 руб.

14.01.2013    188032    1140    0    

912

SALE! 15%

Инструментарий разработчика Программист 8.3.14 1С:Конвертация данных Россия Платные (руб)

Расширение для конфигурации “Конвертация данных 3”. Добавляет подсветку синтаксиса, детальную контекстную подсказку, глобальный поиск по коду.

15000 12750 руб.

07.10.2021    17315    6    32    

42

Инструментарий разработчика Программист Платные (руб)

Менеджер конфигураций 1С — альтернативный стартер информационных баз 1С:Предприятие.

1800 руб.

21.02.2023    7714    8    35    

23
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. yukon 153 18.11.13 12:00 Сейчас в теме
Отлично.

Версия под NativeAPI планируется?
3. Sk0rp 119 18.11.13 13:10 Сейчас в теме
(1) yukon, Какое-либо развитие компоненты не планируется. Была в свое время написана для конкретного проекта. Исходники если найду позже тоже выложу.
36. Sk0rp 119 22.11.13 14:56 Сейчас в теме
(1) yukon, (35) cool.vlad4, не совсем понимаю, что вы называете "Native".
Компонента создана по технологии создания внешних компонент с ИТС. Реализует интерфейс расширения языка.
37. Evil Beaver 8244 22.11.13 14:58 Сейчас в теме
(36) они имеют в виду новый вид API внешних компонент, которые не использует COM. Называется Native API и применяется в 8.2 наряду с COM-компонентами.
39. Sk0rp 119 22.11.13 15:14 Сейчас в теме
(37) Evil Beaver, ясно, спасибо.
Думаю если еще не существует, то появится в ближайшее время обертка, которая позволит любую старую компоненту подключать через новый интерфейс.
40. cool.vlad4 2 22.11.13 15:32 Сейчас в теме
(39) это ближайшее время уже 2-3 года. этот 1С-ский native появился не вчера, его плюс в том, что работает на сервере, в том числе и на nix-ксах(поэтому мне не совсем понятна, какая в этом случае будет обертка, но все возможно), и не требует регистрации.
41. Жолтокнижниг 259 26.11.13 10:25 Сейчас в теме
(39) наврятли появится, т.к. Native поддерживает меньше типов данных (только простые, даже массивы не умеет). Так что придется городить кучу костылей или делать конкретные реализации для каждой COM-вк, но пользы от этого 0.
2. tango 545 18.11.13 12:12 Сейчас в теме
единственная вк, которая принесла пользу
поправьте "пример оспользования" в тексте
4. Sk0rp 119 18.11.13 13:10 Сейчас в теме
(2) tango, Спасибо. Исправил.
5. Yashazz 4791 18.11.13 17:14 Сейчас в теме
Судя по als-файлу, это та самая компонента времён 7.7 и сайта hare.ru, или нет? И вы, sk0rp, её автор?
6. Sk0rp 119 18.11.13 17:46 Сейчас в теме
(5) Yashazz, дважды "да". Действительно впервые она выклыдавалась мной у кролика.
10. Yashazz 4791 19.11.13 20:58 Сейчас в теме
(6) Тогда искреннее большое спасибо, она в те времена изрядно пригодилась. А теперь - большинство будет юзать полнотекстовый поиск, а про расстояние Левенштейна и прочую ересь вообще никто не знает )))
DrAku1a; Valet; +2 Ответить
7. AlX0id 19.11.13 12:54 Сейчас в теме
мм.. это типа можно для распознавания голоса использовать? )
8. tango 545 19.11.13 13:07 Сейчас в теме
(7) AlX0id, скорее для идентификации автора по образцам текстов
9. Sk0rp 119 19.11.13 14:00 Сейчас в теме
(7) AlX0id, нет. Анализируется только текст.
11. Lemkus 20.11.13 10:49 Сейчас в теме
Чем эта компонента лучше полнотекстового поиска?
15. Yashazz 4791 20.11.13 12:05 Сейчас в теме
(11) У полнотекстового поиска есть куча недостатков. Например, область индексации динамически не управляется и любое перестроение кушает время.
16. Makushimo 160 20.11.13 12:26 Сейчас в теме
(15) Yashazz,
можно подробнее?
какие конкретно недостатки у полнотекстового поиска,
которые однозначно склоняют к поиску альтернативы?
например, эта компонента в публикации
28. Yashazz 4791 22.11.13 00:42 Сейчас в теме
(16) Так написал же - область индексации неуправляемая. У меня, допустим, три обалденных регистра сведений отмечены как используемые к полнотекстовому, но обновлял я лишь один регистр и искать хочу по нему - а обновление/слияние прочешет все три, степень гибкости маловата, время и ресурс жалко. Или я чего не знаю про полнотекстовый штатный?
20. Sk0rp 119 20.11.13 13:37 Сейчас в теме
(11) Lemkus, области использования практически не пересекаются. Сравнивать не имеет смысла.

(12) Makushimo, много было взято из metaphone:
http://en.wikipedia.org/wiki/Metaphone
Существует его адаптация и для русского языка.
Затем считается количество совпавших звуков и последовательностей звуков (чем длиннее тем больше вес).
Цифры обрабатываются отдельно.

(13) Evil Beaver, изначально писалось как часть системы для полуавтоматической загрузки сканированных накладных поставщиков. Понятия электронного обмена в то время практически не существовало: была машина со сборной солянкой грузов от 50 поставщиков, коробка из 200 - 300 бумажных накладных и закрытый почти на неделю оптовый склад, т.к. операторам требовалось до 5 дней на обработку. С введением этой системы склад перестал закрываться на время приема вообще, а качество ввода накладных выросло.
22. Lemkus 21.11.13 11:00 Сейчас в теме
(20)
Видимо, я плохо понимаю, что значит "Сравнение производится по звучанию"

Про полнотекстовый поиск в СП:
# - нечеткий поиск слов с заданным количеством отличий от указанного (если не указано, то = 1); пример: запрос "#Система" найдет "систама", "сивтема"; запрос "Система#2" найдет "ситтама", "сеттема";

Разве это не то же самое, что в компоненте, в чем отличия?
23. Sk0rp 119 21.11.13 12:24 Сейчас в теме
(22) Lemkus, не совсем.
Для компоненты будут практически одинаковыми названия:
Whiskey Jack Daniels 500ml
500 Виски жек денил
Whi5key 500 мл /ack Dan|e1s /при распознавании грязного текста/
При этом расстояние Левингштейна между ними очень велико.
akR00b; ger_kar; orfos; Torin99; Evil Beaver; Lemkus; +6 Ответить
24. Evil Beaver 8244 21.11.13 14:25 Сейчас в теме
(23) Круть, дайте две!
Если мне вдруг что-то такое потребуется, буду знать, где скачивать! :)
35. cool.vlad4 2 22.11.13 14:01 Сейчас в теме
(11) Lemkus, тем, что они разные и по разному работают и ищут. во-первых надо заставить хоть как-то полнотекстовый искать "по созвучанию" (с помощью строк поиска, всякими # и прочее), во-вторых полнотекстовый не спрашивает, где искать он ищет во всем объекте, кушает дофига ресурсов и тормозной как не зная кто.
(0) если она была бы под Native, это было бы очень клево. а так компонента очень полезная.
12. Makushimo 160 20.11.13 12:00 Сейчас в теме
А можете написать статью про алгоритм работы этой компоненты?
в картинках и на пальцах.
очень интересно
13. Evil Beaver 8244 20.11.13 12:00 Сейчас в теме
Вроде звучит клёво, но не пойму сходу, в каких практических задачах ее можно применить?
14. tango 545 20.11.13 12:02 Сейчас в теме
(13) Evil Beaver, синхронизация справочников
17. Evil Beaver 8244 20.11.13 12:47 Сейчас в теме
(14) tango, ну может быть... хотя нечеткая синхронизация такого может насинхронизировать....
В синхронизации, как раз идентичность сущностей крайне важна. А так, сегодня у меня отображалось в один объект, а завтра кто-то поменял наименование, его рейтинг в нечетком поиске вырос, и стало отображаться в другой объект...
Но, как вариант первичного слияния двух замусоренных баз с поиском правых и виноватых, да, наверное, можно что-то придумать :)
18. tango 545 20.11.13 12:52 Сейчас в теме
(17) Evil Beaver, разумеется, обработка полуавтоматическая.
ускорение работы оператора вполне реальное
второе применение - подбор в 1с из ексельного файлика (т.н. "проблема номенклатуры поставщика")
alex_sv; Sk0rp; +2 Ответить
19. мх 16 20.11.13 13:30 Сейчас в теме
Спасибо за эту компоненту.
До сих пор используем ее (работаем на 7,7)
(17) Evil Beaver Используем для (первичной) привязки номенклатуры поставщика к собственному справочнику товаров
21. Evil Beaver 8244 20.11.13 18:37 Сейчас в теме
> Сравнение производится по звучанию.
Прикольно, а это как вообще? Падонкафский езыг тоже понимает?
25. tango 545 21.11.13 14:30 Сейчас в теме
да, пожалуй, нынешнее поколение, учившее "полнотекстовый поиск", воспринимает это со своими оттенками эмоций
прикольно, что во времена 77 это воспринималось как будто так и надо
29. Evil Beaver 8244 22.11.13 11:56 Сейчас в теме
(25) tango, вброс не засчитан. Я, конечно, помоложе Вас буду (судя по фотке), но эмоции мои не от того, что я не представляю себе что такое нечеткий поиск, а от того, что теперь такой инструмент есть в общественном доступе. И да, я вряд ли в состоянии написать подобное, поскольку матчастью не владею. Но никому не дано знать все, верно же? Вы вот можете написать точно такую же полностью самостоятельно?
30. tango 545 22.11.13 12:07 Сейчас в теме
(29) Evil Beaver, начиная от "вброс" и далее везде. о чем вы хотите поговорить?
отмечу только, что сабж общедоступен со времен hare.ru - вы не прочитали камент или настолько молоды?
31. Evil Beaver 8244 22.11.13 13:09 Сейчас в теме
(30) tango, да, я настолько молод, что "во времена hare.ru" у меня не было интернетов :) Поговорить, я собственно, ни о чем не хочу, непонятна была причина вашей иронии про "эмоции молодого поколения". Что не так с эмоциями?
32. tango 545 22.11.13 13:27 Сейчас в теме
(31) Evil Beaver, не вижу предмета для иронии, извините
**
наверное, это "репутация"
34. Evil Beaver 8244 22.11.13 14:00 Сейчас в теме
(32) tango, чья "репутация", простите? И что вы хотели этим сказать?
38. tango 545 22.11.13 15:14 Сейчас в теме
26. V.Nikonov 120 21.11.13 18:49 Сейчас в теме
Недавно мучился с синхронизацией расползшихся ИБ. Начал писать собственный алгоритм пословного сравнения... Работало чуть лучше полнотекстового поиска, но не совсем удовлетворяло. Были большие проблемы с сокращением наименований (Молочный - мол.; Шоколадный - Шок; и т.п.). Предлагаемый алгоритм не только нивелирует перестановку слов, но и должен качественно отлавливать всевозможные (разумные) сокращения!
Спасибо Автору!!!
27. V.Nikonov 120 21.11.13 18:57 Сейчас в теме
А возможности скормить компоненте эталон и массив для поиска сложно? На выходе получить отсортированный массив? На низком уровне обрабатывать большой массив легче...
33. Sk0rp 119 22.11.13 13:45 Сейчас в теме
(27) V.Nikonov, именно так и работают кеши. Массив строк загружается один раз и предрассчитывается. Затем с ним можно быстро сравнивать различные образцы, получая на выходе отсортированные ключи (передаются вместе со строкой). Одновременно может быть неограниченное количество созданных кешей.
42. Torin99 284 26.11.13 17:10 Сейчас в теме
А не могли бы Вы сказать, что взято за меру "похожести"? "редакционное расстояние", "мера Джаккарда", "метод триад", расстояние Левенштейна ?
43. Sk0rp 119 26.11.13 18:22 Сейчас в теме
44. Torin99 284 26.11.13 18:48 Сейчас в теме
Все классно, кроме одного -- не хочет работать под операционкой на моем серваке -- Windows Server R2 2008
И добавление указанных Вами длл-ек -- mfc71.dll и msvcr71.dll -- проблему не решает...
45. Sk0rp 119 27.11.13 01:54 Сейчас в теме
(44) Torin99, как правило помогает однократный запуск 1С от имени администратора. На новых системах у компоненты не хватает прав, что бы зарегистрироваться. После этого можно запускать 1С как обычно. Существуют и другие, более специфичные, способы обойти проблемe нехватки прав, но это за рамками обсуждения самой компоненты.
Могу добавить, что я длительное время её использовал на W2k8 Server R2 x64
66. Jill 17 21.11.14 09:32 Сейчас в теме
Я бы еще добавил что в x64 OS необходимо проверять наличие mfc71.dll и msvcr71.dll в C:\Windows\SysWOW64 и класть именно туда.
Как в (44), например.
46. ugroblin 05.12.13 16:14 Сейчас в теме
Спасибо за хорошую вещь. Попробовал, очень понравилось.

Вопрос по выдаваемому коэффициенту. В описании указано "Коэффициент не маштабирован, т.е. его максимальное значение не ограничено". Почему сделано именно так?

Лично мне удобнее использовать нормированный. Так значительно удобнее проводить анализ результатов, отсев по уровню сходности.
StrMatch.Сравнить(А,Б)/StrMatch.Сравнить(А,А)
47. Sk0rp 119 05.12.13 16:45 Сейчас в теме
(46) ugroblin, потому, что там не линейный коэффициент, как переводить его в линейную шкалу процентов не понятно. А по здравому размышлению - не нужно. Все равно интересуют самые похожие из известных.
К стати, StrMatch.Сравнить(А,Б)/StrMatch.Сравнить(А,А) может давать единицу для широкого класса значений Б. А падение значения будет очень сильно зависеть от длины A. Кому-то это может подойти, но не как общее решение для всех.
48. kilo81 09.12.13 16:55 Сейчас в теме
Привет. Оценил эту ДЛЛ-ку в ПиКе. Очень крутая штука.
:) Терь там на 8-ке работают с ней же.
49. CheBurator 2712 12.12.13 17:14 Сейчас в теме
Компонента меганужная.
у меня на ней крутилоась фармация обработка поставщиков - целая система.
для радиодеталей человеку под заказ делал.
сейчас успешно работает на видеодисках.
и еще много где, сейчас уже не упомню за большое количество лет.
.
пример для 7.7 рабочий загрузку заявки покупателя можно посмотреть здесь
http://infostart.ru/public/14255/
.
50. CheBurator 2712 12.12.13 17:17 Сейчас в теме
Пока единственную вещь не удалось забороть, может автор подскажет.
делаю все как обычно, в результате получаю их хеша последовательность похожих на оригинал наименований - все отлично! но при этом индексы сравнения почему-то возвращаются нулевые..

Проявляется эта фигня эпизодически.
есть куча обработко - клоны одной и той же. отличаются незначительно, отличия не касаются работы ссо стрматч, одни обработки - нормально все, другие некоторые их меньше - индекс сравнения - нулевой...
.
????
53. Sk0rp 119 05.01.14 16:55 Сейчас в теме
(50) CheBurator, в старых версиях (стоит проверить на какой это возникает) был баг, приводящий к разным чудесам, если передаваемые для получения результата переменные к этому моменту еще не типизированы. Еще есть вариант, что индекс сравнения и правда ноль :)
А вообще Вам могу выслать исходники, пока сам не потерял :) - попробуйте сами разобраться.
54. CheBurator 2712 05.01.14 17:12 Сейчас в теме
(53) ну что индекс сравнения = 0 - очень маловероятно, а вот вариант с нетипизированными переменными - спасибо за наводку, посмотрю.
.
Вопрос: выложенная компонента в публикации - последней версии?
.
Исходники можно скинуть на e.meil@mail.ru - разобраться я в них вряд ли разберусь, но в запасниках пусть будет - хуже от этого не станет.
56. cool.vlad4 2 05.01.14 19:16 Сейчас в теме
(53) тогда если несложно и мне, пожалуйста, исходники (все таки хочется, если получится перевести компоненту на native) (а еще лучше их в публикации может выложить?)
Tallas; d0dger; Evil Beaver; +3 Ответить
68. CheBurator 2712 06.12.14 19:36 Сейчас в теме
(53) Проверил - насчет того что не выдает индекс сравнения.
см. скриншот - демо ошибки: http://screencast.com/t/0DbCzWI0h - выделенные зеленым должны стоять с самой верхней строки списка

Проблема в том, что если в
СравнитьСКэшем(<Ид>, <Стр>, <Кол>) - если "Кол" будет больше чем размер кеша - вылазит вот такая бяка с нулевыми индексами сравнения...
Поэтому надо определять так, чтобы Кол = Мин(СколькоВыдатьПохожих,РазмерКэша)
51. alexd73 04.01.14 14:25 Сейчас в теме
Привет!
Может быть есть какая-то возможность все-таки провести зависимость от длины искомых фраз? Т.е. у длинной строки значение под 800, а у короткой 50-100.

Т.е. при загрузке накладной можно выводить первые три значения (например), если нет точного соответствия, но хотелось бы ограничивать конкретные промахи. Например коэффициент ниже 50 для строки в 10 символов и ниже 300 для строки под 100 символов.
можно конечно поэксприментировать, но может быть кто-то делал опытные исследования такой зависимости?
52. Sk0rp 119 05.01.14 16:46 Сейчас в теме
(51) alexd73, конечно такая возможность есть. Проблема в том, что их не одна и выбрать среди множества я не представляю как. Но вы вполне можете в своих обработках дополнить логику обычным 1С-ным кодом, масштабируя полученный индекс длиной строки или ограничивая количество вариантов. Как было указано выше - максимальный индекс для конкретной строки можно получить сравнением с нею же. Остальное на Ваше усмотрение.
55. CheBurator 2712 05.01.14 17:14 Сейчас в теме
57. Evil Beaver 8244 05.01.14 21:06 Сейчас в теме
Если не жалко выложите исходники в публикации. Глядишь - будет новый виток развития
Jill; d0dger; +2 Ответить
58. d0dger 84 27.02.14 15:31 Сейчас в теме
Пытаюсь применить компоненту в качестве исправления опечаток вводимых наименований. Наткнулся на эту компоненту, очень интересно, но вероятно не лучшее решение под мою задачу.
За исходники на 1c8x@ukr.net или в публикации буду благодарен...
59. FireFox_Manager 13.08.14 13:54 Сейчас в теме
Вещь!
Вопрос к автору - можно ли использовать компоненту в своих коммерческих разработках?
60. Sk0rp 119 15.08.14 14:24 Сейчас в теме
(59) yinfo, да, можно. С указанием имени и авторства используемой компоненты.
61. FireFox_Manager 21.08.14 07:39 Сейчас в теме
(60) для указания авторства мне нужно знать, как вас зовут - в профиле нет этой информации. И ссылка на источник - ссылка на эту публикацию или у вас есть другая страничка?
63. Sk0rp 119 25.08.14 19:19 Сейчас в теме
(61) yinfo, В архиве с компонентой все есть.
(62) Tim72, Выложу для всех куда-нибудь как руки дойдут.
65. sttt 116 15.10.14 02:29 Сейчас в теме
(63) буду признателен если пришлете исходники: nohd@yandex.ru
62. Tim72 1 21.08.14 21:35 Сейчас в теме
(60)Sk0rp, доброго времени суток! Можете поделиться исходниками? Естественно, распространение с указанием авторства. Буду признателен.
Mail: avparshin@ukr.net
64. bogdan_sukonnov 57 27.08.14 14:04 Сейчас в теме
Для меня главным минусом компоненты является то, что она всегда хоть что-то да находит, а коэффициенты абсолютно безотносительны. Пока решил попробовать в массив поиска добавлять и искомую строку, идея в том, что коэффициент по ней будет хоть каким-то ориентиром. Если есть другие варианты - подскажите, пожалуйста.
67. Famza 85 26.11.14 12:31 Сейчас в теме
Может скажу глупость, но у меня итоговые таблицы получаются очень разными при сравнении двух массивов строк, те ТабИтог1 = Сравнить(Массив1, Массив2) очень отличается от ТабИтог2 = Сравнить(Массив2, Массив1) по количеству элементов. Обработка в 7.7: Массив1 - строки Наименование из Ехеля, Массив2 - строки Наименование из справочника 7.7.
Ось ХР СП3, StrMatch.dll 2.1.0
69. CheBurator 2712 06.12.14 19:38 Сейчас в теме
70. Famza 85 06.12.14 22:48 Сейчас в теме
Еще есть одно замечание. Строка поиска, например, "топор", в кэш помимо данной строки добавлена большая куча строк типа "кольцо стопорное 1234567890" и тд. Если при отборе количество наименований содержащих "топор" большое, то "топор" не то что не получает максимальный индекс, но и вообще не попадает в выборку. Такое ощущение, что поиск в самом деле настолько "нечеткий", что не видит полного совпадения вплоть до длины слова. Аналогично не определились "тяга", "реле" и тд. - вместо них подобрались более длинные с маркировкой типа "тяга поперечная ХХХХХХ", " реле ХХХ". А если увеличивать количество выбираемых похожих слов, то процесс поиска затягивается чрезвычайно.
Вразумите, мож что надо сделать помимо того что указано в примере?
ЗЫ. Свою задачу решил, но пришлось использовать несколько проверок дополнительных. И хотя для 14300 позиций не определились вообще только 18, не находить по полному соответствию как-то... неправильно.
71. CheBurator 2712 09.01.15 20:33 Сейчас в теме
(70) тут совпадения по фонетическому зваучанию.
на коротких словах работает плохо.
на длинных - оч.хорошо, даже если значительная часть слова совпадает а разнятся малой частью
72. Sk0rp 119 25.03.15 15:35 Сейчас в теме
Какая-либо работа над компонентой прекращена и не планируется в обозримом будущем. Найденные исходники выложены сюда:

https://github.com/5k0rp/StrMatch

Возможно, исходники не самые свежие, т.к. в какой-то момент они терялись из-за умершего диска. Как и что удалось восстановить - не помню.
Evil Beaver; tormozit; NFF; sttt; st00; Belomor; Tim72; Famza; yukon; cool.vlad4; +10 Ответить
73. Famza 85 09.06.15 14:02 Сейчас в теме
(72), Очень жаль. Вещь таки нужная
76. Tim72 1 31.08.15 11:43 Сейчас в теме
(72), Огромное спасибо за исходники!
Работаю в аптечном бизнесе 12 лет -- компонента очень сильно помогает искать название лекарств по фонетике (не все же покупатели знают из точное написание ;-) ).
74. AntonH851 88 14.07.15 15:23 Сейчас в теме
А у меня при вызове ПодключитьВнешнююКомпоненту 1С прекращает работу, при этом никаких ошибок, уже все перепробовали...
75. AntonH851 88 15.07.15 11:05 Сейчас в теме
На каких операционных системах она работает вообще?
77. e-ilyich 4 21.11.15 13:19 Сейчас в теме
StrMatch.dll в win 8 x64 не могу зарегистрировать
без регистрации ругается что нет у меня msvcr71.dll

хотя я все что в инструкции сказано сделал в system32 положил файлики MFC71.dll, msvcr71.dll
может под восьмерку нужно какието специальные файлики ?
78. yukon 153 30.11.15 18:13 Сейчас в теме
(77) e-ilyich,
сказано сделал в system32 положил файлики MFC71.dll, msvcr71.dll


Для 32-битных приложений в 64-битной системе, нужно выкладывать в C:\Windows\SysWOW64

Времена меняются, инструкция написана еще в те времена, когда 64-битные клиентские ОС были далеким будущим.
79. tormozit 7230 17.04.16 13:24 Сейчас в теме
Спасибо. Реализовал с помощью этой ВК нечеткий поиск дублей в инструменте "Поиск дублей и замена ссылок" в подсистеме "Инструменты разработчика".
shu_vol; CheBurator; +2 Ответить
80. CheBurator 2712 18.04.16 01:17 Сейчас в теме
(79) о! на это дело надо посмотреть, как у тебя это получилось... учти что для коротких строк работает плохо. чем длиннее строка, тем лучше. В ряде случаем нужно подымать/опускать вес чисел.
81. tormozit 7230 18.04.16 08:17 Сейчас в теме
(80) В каждой паре я нормализую разницу веса к весу наибольшего из пары и сравниваю с порогом.
82. Steelvan 306 18.04.16 09:18 Сейчас в теме
(79) tormozit,


Реализовали как Native ?
83. tormozit 7230 18.04.16 09:35 Сейчас в теме
(82) Нет. Здесь же только COM вариант ВК. Его и использовал.
84. ostapchenko.alexandr 21 30.12.17 11:33 Сейчас в теме
Я бьюсь второй день. Что я только не делал, даже установил виртуальную машину Windows XP. Пишет ошибку на строке Новый COMОбъект:
-2147467262(0x80004002): No such interface supported

Даже скачал dll автора, хотя был у меня уже этот dll. Ошибка та же!
85. Gkmy 28 03.01.18 03:28 Сейчас в теме
86. ostapchenko.alexandr 21 06.01.18 07:17 Сейчас в теме
(85) Windows 10 64, но также пробовал на WIndows 7 64 и Windows 8 64. Создавал на них виртуальные машины Windows XP 32. Но всегда одна ошибка про No such interface supported.
И в SYSWIN64 помещал и COM+ создавал, и всё очищал и заново пробовал. Ничего не помогло.
87. Gkmy 28 08.01.18 11:17 Сейчас в теме
(86) Спрошу иначе.. 8.х или 7.7?
88. ostapchenko.alexandr 21 09.01.18 09:45 Сейчас в теме
89. Gkmy 28 13.01.18 21:58 Сейчас в теме
(88) "Компонента для нечеткого сравнения строк. Это (!!) репост моей публикации из "Клуба профессионалов 1С" .. Какая-либо работа над компонентой (!!) прекращена и не планируется в обозримом будущем. Найденные исходники (!!) выложены ... StrMatch.dll - сама компонента. Версия 2.1.0 от (!!) 4 февраля 2005 ... Для работы (!!) требуется ... mfc71.dll и msvcr71.dll - если нет (не имеются в наличии см. далее - прим. мое), то найти в инете", - внимательно ознакомившись с вышеизложенным, дорогому читателю следует включить тумблер в положение: мозги.. В случае же отсутствия последнего: - Дорогой друг, пишите лично, сюда: https://infostart.ru/connect/?id=342676 - а лучше в телегу, ее в последнее время читаю все чаще.
90. CheBurator 2712 28.09.21 13:18 Сейчас в теме
Удалено... Ступил... Все работает...
Оставьте свое сообщение