Изображение в текст. Распознавание документов для 1С

20.04.2025 14:47:50   Илья Низамов (IlyaNizamov)    1142

Всем привет, с вами Низамов Илья. Недавно ко мне пришел клиент с интересным запросом. Задача была в том, чтобы распознавать часть реквизитов с транспортных накладных и водительских удостоверений и вносить эти данные в 1С.

Решать данную задачу можно разными путями, но пойдем самым простым. Сейчас практически все llm мультимодальные и умеют обрабатывать изображения. Я провел много экспериментов с разными моделями, в том числе и с локальными. Некоторые показали себя в этой задаче практически на уровне ChatGPT 4, но в итоге лучше всего справилась с этой задачей модель от google, gemini 2.0 flash.

Показать как распознает накладные я не могу, так как там присутствуют реквизиты клиента и его контрагентов, а вот для задачи распознавания водительских удостоверений я подобрал несколько примеров из интернета.

Для простоты я покажу все в боте, а так у данного сервиса есть свое API и отправлять картинки на распознавание можно из любой системы, в том числе и 1С.

Категории:
 Разное

Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
Для отправки сообщения требуется регистрация/авторизация
Айдар Сафин. Код без выгорания: комплексный подход к здоровью программиста
Иосиф Правец. Эргономичные клавиатуры в помощь аналитику, или как полюбить процесс набора текста
Екатерина Кандыба. 1С-STORE: магазин решений в вашей 1С
Николай Пикалев. Интеграция между 1С без боли и страданий
Екатерина Александрова. Всё про ЭЦП. Разбираемся в тонкостях электронной подписи
Андрей Крапивин. Эргономичное рабочее место. Сколько это стоило и зачем?
Лилия Салахова. "Я самозванец", или как найти плюсы в профессиональных синдромах?
Евгения Ковалева. Как готовить членов проектной команды в условиях нехватки кадров
Интервью Вадима Цыгикало – об 1С:ERP и управлении ИТ в производстве осветительного оборудования
Антон Дорошкевич. Как сделать ИТ доклад, чтобы не было смертельно скучно