Изображение в текст. Распознавание документов для 1С
- Плеер:
- RuTube
Всем привет, с вами Низамов Илья. Недавно ко мне пришел клиент с интересным запросом. Задача была в том, чтобы распознавать часть реквизитов с транспортных накладных и водительских удостоверений и вносить эти данные в 1С.
Решать данную задачу можно разными путями, но пойдем самым простым. Сейчас практически все llm мультимодальные и умеют обрабатывать изображения. Я провел много экспериментов с разными моделями, в том числе и с локальными. Некоторые показали себя в этой задаче практически на уровне ChatGPT 4, но в итоге лучше всего справилась с этой задачей модель от google, gemini 2.0 flash.
Показать как распознает накладные я не могу, так как там присутствуют реквизиты клиента и его контрагентов, а вот для задачи распознавания водительских удостоверений я подобрал несколько примеров из интернета.
Для простоты я покажу все в боте, а так у данного сервиса есть свое API и отправлять картинки на распознавание можно из любой системы, в том числе и 1С.
Решать данную задачу можно разными путями, но пойдем самым простым. Сейчас практически все llm мультимодальные и умеют обрабатывать изображения. Я провел много экспериментов с разными моделями, в том числе и с локальными. Некоторые показали себя в этой задаче практически на уровне ChatGPT 4, но в итоге лучше всего справилась с этой задачей модель от google, gemini 2.0 flash.
Показать как распознает накладные я не могу, так как там присутствуют реквизиты клиента и его контрагентов, а вот для задачи распознавания водительских удостоверений я подобрал несколько примеров из интернета.
Для простоты я покажу все в боте, а так у данного сервиса есть свое API и отправлять картинки на распознавание можно из любой системы, в том числе и 1С.
Подписаться на ответы
Инфостарт бот
Сортировка:
Древо развёрнутое
Свернуть все
Прямая ссылка:
BB-код для форумов и блогов:
HTML-код:
BB-код для форумов и блогов:
HTML-код: