Сравнение строк

08.11.18

Алгоритм сравнения строк - вычисление коэффициента "похожести" двух строк в диапазоне от 0 до 1.

Файлы

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование	Скачано	Купить файл	По подписке PRO
Обработка "Сравнение строк" .epf 6,89Kb 112	112	2 500 руб. Купить	1 SM Скачать

В свое время мне пришлось решать следующую задачу: загрузить отчет комиссионера, состоящий из порядка 10 000 строк, предоставленный в электронном виде, в базу данных комитента (УТ 10.2). Проблема была в сопоставлении номенклатуры, так как кодов не было, а наименования не совпадали - вводились различными людьми в разных местах независимо, иногда с ошибками и по разным принципам.

Для хранения соответствий номенклатуры я добавил регистр сведений и решил заполнить его наиболее похожими позициями из справочника номенклатуры базы данных. Далее оператор должен только утвердить найденный автоматически вариант или выбрать другой, ориентируясь при этом по коэффициенту "похожести", сформированному при автоматическом подоборе номенклатуры.

Для решения этой задачи мне нужна была функция, которая позволит вычислить для заданного наименования товара из отчета коэффициенты "похожести" по всем позициям справочника номенклатуры, чтобы в качестве соответствия выбрать номенклатуру с наибольшим коэффициентом. Для возможности такого сравнения необходимо, чтобы функция выдавала результат сравнения из одинакового для любых входных строк диапазона (то есть оценка должна быть нормированной). Подходящей функции я тогда не нашел (одна из них не давала нормированной оценки, другая не понравилась мне алгоритмом - нужно было вводить количество символов в анализируемых комбинациях непонятно исходя из чего), но это меня даже обрадовало, так как задача показалась мне интересной и я решил написать собственную функцию на языке 1С. В скором времени функция была написана и с ее помощью задача была успешно решена.

Результат представляю вашему вниманию - во вложении обработка с двумя полями ввода - Строка1 и Строка2 и кнопкой "Сравнить", результат - коэффициент похожести в диапазоне от 0 до 1 выводится в окно сообщений. Алгоритм чувствителен порядку следования символов в строках - 2 разных набора одних и тех же символов дадут в общем случае различные результаты сравнения.

Немного об особенностях реализации - сначала вычисляются автокорреляционные функции для каждой из строк, после чего бОльшая из вычисленных величин выбирается в качестве нормирующей. Далее вычисляется взаимная корреляция строк и нормируется вычисленной на предыдущем этапе величиной (путем деления результата на нее), что гарантирует нахождение определенного таким образом коэффициента в диапазоне от 0 до 1.

При вычислении исходные строки преобразуются в массивы, что позволит, если будет необходимо, легко перевести этот алгоритм на другие языки программирования. Недостатком данного алгоритма является относительно низкая скорость работы - за все приходится платить. Надеюсь, кому нибудь пригодится!

P.S.

Модуль СКБ Контур говорит автору спасибо - пожалуйста.

Готовое решение

ККТ-ОНЛАЙН 54-ФЗ: Обработка для работы онлайн касс АТОЛ, ШТРИХ, VIKI PRINT и т.д. МАРКИРОВКА (Разрешит. режим) + ЭКВАЙРИНГ + БЕСПЛАТНЫЙ ДЕМО

Универсальная обработка для фискальных регистраторов! Подключайте любые ККТ, включая Веб сервер АТОЛ, без обновления 1С и работайте с несколькими кассами одновременно. Тестовый доступ — бесплатно!

Узнать подробнее

Вступайте в нашу телеграмм-группу Инфостарт

+34 –

См. также

SALE! %

Infostart MagicInput

Мастера заполнения Поиск данных База данных Инструментарий разработчика Корректировка данных Универсальные функции Механизмы платформы 1С Подбор и обработка объектов 1С 8.3 1С 8.5 Платные (руб)

Infostart MagicInput улучшает подбор в полях ввода 1С: ищет по любой части названия и по нескольким ключевым фрагментам, распознаёт ввод в другой раскладке и показывает иконки/статусы объектов прямо в списке. Поддерживает вставку навигационной ссылки/представления документа для автоподбора; для разработчиков доступны поиск по GUID и полному имени предопределённого. Работает в управляемых формах и подключается в большинстве конфигураций 1С 8.3/8.5.

~~5000~~ 4000 руб.

25.02.2026 1944 9 1

15 мифов о платформе 1С

Механизмы платформы 1С Программист Бесплатно (free)

Разберем 15 мифов о работе платформы «1С:Предприятие 8» – как распространенных, так и малоизвестных. Начнем с классики: «Код, написанный в одну строку, работает быстрее, чем многострочный». Так ли это на самом деле?

16.07.2025 30168 TitanLuchs 106

149

Текучий интерфейс в 1С

Механизмы платформы 1С Работа с интерфейсом Программист Стажер 1С:Предприятие 8 Бесплатно (free)

Про ООП в 1С и о том, как сделать свой код более кратким и выразительным при помощи использования текучего интерфейса (fluent interface).

03.02.2025 16466 bayselonarrend 127

XDTO и работа с JSON

Механизмы платформы 1С Программист 1С:Предприятие 8 Бесплатно (free)

В этой статье подробно рассматривается работа с JSON в XDTO в 1С:Предприятие. Вы узнаете, как сериализовать и десериализовать объекты XDTO в JSON, интегрировать 1С с веб-сервисами и API, а также корректно обрабатывать данные при обмене. Разбираются особенности работы с коллекциями, использование функций восстановления и частые ошибки при работе с JSON и XDTO.

30.01.2025 19662 user2122906 9

Гайд по XDTO для чайников

Механизмы платформы 1С Файловый обмен (TXT, XML, DBF), FTP Программист 1С:Предприятие 8 Бесплатно (free)

Этот материал познакомит вас с механизмом XDTO (XML Data Transfer Objects) в 1С и научит эффективно использовать его возможности. Мы разберёмся, как работать с XML-схемами, создавать модели данных, манипулировать объектами XDTO, а также сериализовать и десериализовать их в XML. Вы узнаете, как использовать XDTO для интеграции с внешними системами, избегать типичных ошибок и оптимизировать код. К концу вы будете уверенно применять XDTO для решения сложных задач обмена данными и автоматизации процессов.

17.01.2025 33928 user2122906 12

Поинтегрируем: WebSocket’ы в платформе 1С. Часть 1

Механизмы платформы 1С WEB-интеграция Программист 1С:Предприятие 8 Бесплатно (free)

В платформе 8.3.27 появилась возможность использовать WebSocket-клиент. Давайте посмотрим, как это все устроено и чем оно нам полезно.

14.01.2025 30644 dsdred 100

147

Передача параметров процедур и функций. Особенности "Знач"

Механизмы платформы 1С Программист 1С:Предприятие 8 Бесплатно (free)

Особенности "Знач" и разбор документации к нему.

10.01.2025 17430 VAAngelov 59

109

Файловые потоки в 1С

Механизмы платформы 1С Программист Стажер 1С:Предприятие 8 1C:Бухгалтерия Бесплатно (free)

Эта небольшая статья - некоторого рода шпаргалка по файловым потокам: как и зачем с ними работать, какие преимущества это дает.

23.06.2024 27174 bayselonarrend 22

176

Комментарии

Подписаться на ответы Инфостарт бот

Свернуть все

1. Altair777 649 08.08.12 16:35 Сейчас в теме

Какой из алгоритмов используется?

2. AlexO 136 08.08.12 16:37 Сейчас в теме

(1) Altair777,

Недостатком данного алгоритма является относительно низкая скорость работы

Боюсь, что не самый и интересный.

3. Altair777 649 08.08.12 16:46 Сейчас в теме

(2) AlexO, самопал? :)

5. AlexO 136 09.08.12 14:10 Сейчас в теме

(3) Altair777,
что-то вроде "сравннеия в лоб", без применения алгоритмов сортировок и оптимизаций :)

6. Altair777 649 09.08.12 17:19 Сейчас в теме

(5) AlexO, а зачем? :)

Сравнение строк. Стандартный алгоритм.
Алгоритм Кнута-Морриса-Пратта
Алгоритм Бойера-Мура

4. petrov_al 10 09.08.12 10:13 Сейчас в теме

А как же "полнотекстовый поиск" 1с не пробовали?

7. CheBurator 3234 10.08.12 01:25 Сейчас в теме

сто лет в обед ;-) давно и с успехом данную задачу решает ВК strmatch (можно использовать в снеговике) - http://infostart.ru/public/14255/ - к достоинствам (для большого класа задач) данной ВК следует отнести: нечувствительность не "незвуковым" символам, поддержка фонетической похожести (отзыв и otzyv будут весьма близки). Так что на этой хрения в agfvfwbb у меня был накручен основной мегафункционал - разработки на основе этой ВК успешно работают н аавтозапчастях, игрушках, электробытовых приборах итд (как пример: http://infostart.ru/public/15996/). чем длиннее сравниваемая строка - тем работает лучше. В приведенном примере - по радиодеталям, где почти все зависит от цифробуквенной маркировки - где многоцифр и маркировка короткая - работало затруднительно - все на все похоже с большоим подобием ;-) пришлось ввести парочку эмпирических правил, которые существенно улучшили ситуацию. Лекарственные прайсы по 10 тыс позиций у меня автоиндентифицировались (примерно на 60-80% - как чувсвтительность выставишь) минут за 40 в далеком 2004-2006гг.
.
а во время моих длительных скитаний по стране 1С - такой алгоритм как у автора давным давно на 7.7 был написан еще на встроенном языке. Так что - как обычно - мы впереди планеты всей в изобретении велосипедов ;-)
.
так что разработка автора представляет весьма ограниченный интерес. ибо колесо - оно и есть колесо. но вот если бы автор привел сравнение своего алгоритма, strmatch. полнотекствого поиска снеговика итд - вот это было бы интересно.. сразу бы стало понятно - на что претендует автолр - на колесо для волокуши из цельного куска дерева или на высокотоехнологичное колесо гоночного велосипеда.

8. TSSV 1162 10.08.12 08:29 Сейчас в теме

(7) CheBurator, ваша информация интересна. Я представил конкретный алгоритм с ОТКРЫТЫМ кодом (в отличие от strmatch и пр.). Ваш восторг по поводу "нечувствительность не "незвуковым" символам" вполне объясним - довольствоваться приходится тем что есть.

а во время моих длительных скитаний по стране 1С - такой алгоритм как у автора давным давно на 7.7 был написан еще на встроенном языке.

Приведите ссылки на его описание - интересно насколько он "такой" и когда был написан и где (может на заборе?).
По поводу сравнения - мне самому было бы интересно сравнить работу моего алгоритма с другими, будет время, напишу об этом отдельно. НО, еще раз (для самых одаренных) - я предоставил алгоритм, он перед вами - сравнивайте!

13. tango 551 29.08.12 16:08 Сейчас в теме

+(7) CheBurator,
strmatch == рулёз

9. sashapere 160 15.08.12 16:50 Сейчас в теме

Спасибо, нужная вещь!

10. ZLENKO 398 29.08.12 13:33 Сейчас в теме

С практической точки зрения больший интерес представляет применение полнотекстового поиска. Например, для поиска похожих контрагентов при вводе нового контрагента. Каждый раз вычислять похожесть двух строк при количестве контрагентов несколько тысяч будет достаточно медленно. Когда в 1С еще не было полнотекстового поиска для получения приемлемого быстродействия приходилось извращаться с монструозным запросом использующим анализ вхождения подстрок искомой строки в поле базы данных. Теперь с полнотекстовым поиском все проще.

11. TSSV 1162 29.08.12 14:11 Сейчас в теме

(10) 1с-программы.com, спасибо за интерес к моим работам. Придется вас огорчить - полнотекстовый поиск и сравнение строк это несколько разные все таки вещи, хотя издалека действительно похожи. Задачи, которые можно решить с помощью полнотекстового поиска не стоит решать с помощью сравнения строк.

12. ZLENKO 398 29.08.12 15:00 Сейчас в теме

(11) Не нужно меня огорчать :-) Конечно это разные вещи. Просто мне так сразу в голову не приходит практическое применение в рамках эксплуатации продуктов 1С алгоритма сравнения двух строк на похожесть.
Если не секрет - с какой целью Вы его писали ? Просто интересно.

Инфостарт выдает список других разработок автора, поэтому я еще заинтересовался и другими вашими разработками. Не подумайте - ничего личного :-)

14. TSSV 1162 04.06.13 20:21 Сейчас в теме

Вот пример практического применения фукнции сравнения строк:
http://infostart.ru/public/173260/

15. fishca 1313 23.10.15 09:08 Сейчас в теме

Модуль обработки СКБ-Контур говорит автору спасибо, а я передаю.

16. TSSV 1162 23.10.15 09:59 Сейчас в теме

(15) fishca, Спасибо! Приятно получить такой отзыв :)

Для отправки сообщения требуется регистрация/авторизация

Автор:

Сергей Царегородцев (TSSV)

Рейтинг: 1162

Для получения уведомлений о новых публикациях автора подключите телеграм бот: Инфостарт бот

Публикация:

№ 146559

Создание 08.08.12 20:21

Обновление 08.11.18 12:02

Статистика:

Просмотры 25346

Загрузки 112

Рейтинг 34

Комментарии 17

Характеристики:

Код открыт Да

Рубрики Механизмы платформы 1С

Кому Системный администратор ,
Программист

Тип файла Внешняя обработка (ert,epf)

Платформа 1С:Предприятие 8

Конфигурация 1C:Бухгалтерия

Операционная система Не имеет значения

Страна Россия

Отрасль Не имеет значения

Налоги Не имеет значения

Вид учета Не имеет значения

Доступ к файлу Абонемент ($m)

Сравнение строк

Файлы

ККТ-ОНЛАЙН 54-ФЗ: Обработка для работы онлайн касс АТОЛ, ШТРИХ, VIKI PRINT и т.д. МАРКИРОВКА (Разрешит. режим) + ЭКВАЙРИНГ + БЕСПЛАТНЫЙ ДЕМО

См. также

Журнал

База знаний

Лаборатория

Анализ & Управление

Сопровождение 1С

Корпоративные решения

Обучение

Маркетплейс

Проектный офис

Мероприятия

Видеозаписи

Биржа заказов

Форум

Мерч

О компании