Векторизация текста на языке 1С. Простейший пример. Используется в реальной работе в обработке Контур.Диадок при подборе Склада по произвольному человекочитаемому комментарию, содержащему Адрес склада (и другую инфомрацию)
Подходит для использования, если нужно осуществить нечеткий поиск по 100-200 строкам и найти 1 лучшее вхождение (которое гарантированно там есть). Также
- инвариантно к РеГиСтРу, наличию повторению илиотсутствиюв тексте пробелов и знаков препинания и т.д.
- инвариантно к положению мест словами (слов местами)
- множество значений функции КосинусноеПроизведение: [0; 1] - можно спрогнозировать порог адекватности похожести строк
- приемлемая скорость поиска ~100 строк/сек
- легко внедрять: 3 функции/50 строчек кода, работающие в любой конфигурации.
Проверено на следующих конфигурациях и релизах:
- Управление нашей фирмой, редакция 3.0, релизы 3.0.9.163
- Управление торговлей, редакция 11, релизы 11.5.19.74