Почему возникла идея прикрутить распознавание к 1С? Потому что 1С обладает неоспоримым преимуществом - она обеспечивает лингвистическую поддержку на уровне реквизитов ИБ с их типами данных и значениями! Например требуется распознать в анкете поле "Сотрудник" - это уже ограничено значениями справочника "Сотрудники" а не всеми словами русского языка, а если учесть что можно отборать (т.к. это 1С мы можем делать что хотим) для конкретного документа только тех сотрудников, котрые в коммандировке - то и вовсе несколько строк получается. Таким образом даже если система неправильно распознает одну или даже несколько букв, всегда можно проверить проверочным словарем - отборанными сотрудниками, и автоматически же исправить, чтобы система обучилась и в следующий раз не повторяла эту ошибку.Это большое преимущество перед другими системами, которое может сделать распознавание вполне приемлемым. Кроме того код, написанный на 1С могут править все 1С программисты.
Работа с обработкой состоит из двух этапов:
1)Первичное обучение на закладке обучение. Требуется написать по 3 буквы собсвенным почерком и сопоставить им символы с клавиатуры. Вприниципе этот этап можно было бы исключить, но так быстрее сеть входит в свое рабочее состояние.
2)Распознавание. Можно использовать саму обработку просто чтобы посмотреть,но смысл конечно в том, чтобы встроить это в свою конфигурацию.
Области данных на обеих закладках нужны для того чтобы не обрабатывать весь документ, а указать примерно где какие реквизиты искать. Эти области задаются в пикселях X1,Y1 - верхний левый угол;X2,Y2-правый нижний угол области. Для того чтобы из примерно определить можно открыть картинку в Paint-е или другом редакторе, который показывает пиксели - в левом, нижнем углу будут эти самые пиксели.
Смысл алгоритма работы изображен на схеме. Сначала происходит распознавание "квадратиков" - это пока не сеть, а предопределенный алгоритм.Этот адгоритм ищет вертикальные и горизнтальные прямые линии. Прямую линию он понимает как целую фигуру, у которой длина существенно больше ширины. Пара вертикальных и пара горизонтальных линий - это и есть "квадратик" в который пишутся буквы. Алгоритм "вырезает" буквы из "квадратика" и записывает в матрицу, чтобы предать дальше для распознавания.
Затем идет распознавание и обучение сети. Почему я использую однослойную сеть? Потому что один слой обрабатывается на этапе распознавания быстрее чем n-слоев. И при этом, что самое важное сеть можно организовать соптимизировать так, что найдется некая карта у которой совпадение будет максимально "заточено" под входной результат, т.е. изначально с большей степенью вероятности будет попадание в 10-ку. Этим как раз и занимается алгоритм самооптимизации(нет в light version). На эту обработку тоже тратится процессорное время, но это происходит позже, в фоне а не на этапе распознавания.
В архиве приложены примеры образца для первичного обучения и для распознавания - эти примеры сеть распознает абсолютно точно. На них можно проверить как это работает.
Технические требования для работы:
1)Для работы необходимо скачать и установить GFLAx http://www.xnview.com/en/GFL/#downloads
2)В конфигурации должен быть справочник ХранилищеДополнительнойИнформации - т.е. как в любой типовой конфе.
Ограничения при работе с данным релизом:
1)Не реалзована подгонка размеров, поэтому первоначальное обучение и дальнейшая работа должна происходить примерно с одним размером картики, что легко достигается при использовании сканера. Т.е. например если в начальных образцах толщина букв(не ширина а именно толщина) 3 пикселя то и дальше толщина должна быть тоже примерно 3 пикселя.
2)Распознавание на черно и белое прописано в функции ПрочитатьМатрицу() для глубины цвета 24 - возможно потребуется поменять этот параметр для конкретных условий(более темная и светлая картинка) или другой глубины. Желательно(не обязательно) предварительное преобразования в B&W, так можно убедиться что черно-белая картинка впринципе читаема.
3)Разрешение и скорость работы. Чем больше разрешение тем ниже скорость работы, но выше точность. В приложенном образце толщина букв примерно 4 символа распознавание максимально достоверное, но скорость не очень. Можно снижать до 2 - скорость резко возрастает.
Ну и самое главное - это сложная штука, с которой нужно повозиться. Это не готовый продукт, да и сама нейросеть не может быть готовым продуктом, т.к. встраивается в конкретную конфигурацию,обучается под конкретные условия. Так что не спешите минусовать, если что то не работает. В общем, надеюсь эта обработка поможет тем кто решил заняться чем то подобным. Сам я готов ответить на любые вопросы по теме.