Область применения
Функционал данной разработки можно внести в любую конфигурацию 1С (если есть возможность изменения конфигурации) для последующего использования. Данный продукт представляет собой полноценную демо-базу, на которой можно протестировать работу алгоритма и перенести функционал на рабочую базу. Данная услуга предоставляется "Встраивание функционала анализа текста в произвольную конфигурацию заказчика".
Анализ (разбор) текста можно использовать в любой программе, где из текстового поля (строки) нужно получить определенные данные в нужном формате. Примеры, где можно использовать анализ текста:
- Назначения платежей в платежных поручениях (в назначении платежа часто указывают номер/дату счета или акта, по которому произведен платеж),
- Электронные письма и сообщения пользователей (в рабочей переписке можно встретить много номеров/дат документов, контактов и т.д.),
- Комментарии в документах.
Анализ текста не является тривиальной задачей, особенно если нет жестких правил написания исходного текста. Выявление в тексте нужных слов и конструкций можно считать элементами искусственного интеллекта. Проблема заключается в том, что один и тот же фрагмент текста может быть по-разному интерпретирован. Для анализа текста могут применяться различные методы в зависимости от специфики области, универсального решения данной задачи нет, но частные решения с определенными ограничениями есть.
Технические требования
Разработка на базе 1С для анализа произвольного текста с заранее определенным словарем слов. Программа достаточно гибкая, прошла тестирование на реальных данных (назначения платежей в платежных поручениях).
Функциональные возможности
- распознавание слов и их сокращений,
- распознавание кортежей слов (конструкции из нескольких слов),
- распознавание параметров у элементов, у которых определены параметры,
- распознавание групп в параметрах (например «по Счетам №444,446,447»),
- корректное распознавание интервалов чисел в группах (например «100-110,132,134-136»).
Поставка
Программа поставляется в виде базы 1С с начальными данными (словарем). Запуск функционала производится из встроенной обработки. Задается исходный текст, на выходе получается список документов с номерами и датами, которые получилось извлечь из исходного текста.
Алгоритм
Вначале работы алгоритма данной программы создается схема с первичным разбиением групп символов на типы данных (текст, число, дата, знаки препинания, скобки, особые символы).
В общих чертах сам алгоритм представляет собой цикл, который состоит из 5 этапов преобразования построенной схемы. Цикл продолжается до тех пор, пока в одном из этапов произошло изменение. При работе обработки есть возможность указать уровень трассировки для просмотра схемы на каждом шаге цикла (0 – без трассировки, 1 – краткая трассировка, 2 – подробная трассировка).
Этапы (по названиям функций):
- РаспознатьСлова (слова из словаря, возможно с сокращениями, например «Счет»)
- РаспознатьКортежи (например «Счет на оплату»)
- РаспознатьЧисла (например «5 045 898.03», выполняется 1 раз)
- РаспознатьГруппы (разбор конструкций, разделенных «,» и «;», выполняется если 1-3 этапы прошли без изменений)
- РаспознатьПараметры (извлечение номеров и дат документов, например номер счета, выполняется если 1-3 этапы прошли без изменений)
Этапы введены для того, чтобы правильно распознавать группы и параметры из текста. Без этапов не получилось найти общий алгоритм, который за 1 проход правильно распознал документы и их параметры (номер и дату) по платежным поручениям 1 предприятия.
Примеры работы алгоритма
Исходные данные | Результат |
(189.0306.345.3453.244=18722-45 л/с0444А54440) Опл по сч. на опл № 246-253 ,256от20.04.16г.,Акт №209-213,215-218 от 20.04.16г.,Гос. контракт№334533/38от01.04.16 за транс-экспед.услуги,в т.ч.НДС 2855,97 | [лицевой счет] Номер: 0444А54440 [счет на оплату] Номер: 246-253,256; Дата: 20.04.2016 [акт] Номер: 209-213,215-218; Дата: 20.04.2016 [гос контракт] Номер: 334533,38; Дата: 01.04.2016 |
усл по перевоз молочн.продукц.,по сч.на опл262от21.04.16,сч.на опл.270от22.04.16,сч.на опл.273от22.04.16,ГК066654401160000343-0000963-01от04.04.16в тчНДС(18%)2 712,70 | [счет на оплату] Номер: 262; Дата: 21.04.2016 Номер: 270; Дата: 22.04.2016 Номер: 273; Дата: 22.04.2016 [гос контракт] Номер: 066654401160000343-0000963-01; Дата: 04.04.2016 |
(л/с065567730) Оплата за автотранспортные услуги по перевозке грузов, Дог 46 от 24.03.2016 акт 130 от 30.03.16,195 от 15.04.2016, в т.ч. (НДС 18%) - 12661,02 | [договор] Номер: 46; Дата: 24.03.2016 [лицевой счет] Номер: 065567730 [акт] Номер: 130 от 30.03.2016,195 от 15.04.2016 |
СФ 4555 от 15.04.2016, п/п 55444 от 11.04.2016 | [счет фактура] Номер: 4555; Дата: 15.04.2016 [платежное поручение] Номер: 55444; Дата: 11.04.2016 |
акт 100,102-109,211-233 от 11.04.2016 | [акт] Номер: 100,102-109,211-233; Дата: 11.04.2016 |
Программный продукт предоставляется в виде отдельной конфигурации. Для проверки функционала дополнительная конфигурация не нужна. Отдельно добавлена услуга по интеграции разработки в любую другую конфигурацию.
Техническая поддержка и обновления
Бесплатный период техподдержки составляет 1 месяц со дня покупки
Также после приобретения вы получаете 1 месяц бесплатных обновлений.
По окончании бесплатного периода вы можете приобрести услугу технической поддержки с доступом к обновлениям на платной основе.
Проверить наличие обновлений можно в личном кабинете. Если обновления недоступны - загрузить новую версию можно после покупки обновлений/технической поддержки.
Задать вопрос по программе можно по кнопке "Техподдержка" на странице описания.
При создании тикета необходимо предоставить:
- Номер заказа
- Описание вопроса. Если это ошибки - напишите порядок ваших действий с программой, которые к ней привели (приложите видео/скриншоты/отчеты об ошибке)
- Точную конфигурацию 1С, и версию платформы, на которой используете купленное решение (наименование и версию 1С можно взять из раздела "О программе"), версию купленной программы.
К созданной заявке подключается специалист. Дальнейшее обсуждение проблемы будет проходить в тикете техподдержки. Стандартный срок реакции - 24 часа в рабочие дни с момента обращения.