Изображение в текст. Распознавание документов для 1С

20.04.2025 14:47:50   Илья Низамов (IlyaNizamov)    27

Всем привет, с вами Низамов Илья. Недавно ко мне пришел клиент с интересным запросом. Задача была в том, чтобы распознавать часть реквизитов с транспортных накладных и водительских удостоверений и вносить эти данные в 1С.

Решать данную задачу можно разными путями, но пойдем самым простым. Сейчас практически все llm мультимодальные и умеют обрабатывать изображения. Я провел много экспериментов с разными моделями, в том числе и с локальными. Некоторые показали себя в этой задаче практически на уровне ChatGPT 4, но в итоге лучше всего справилась с этой задачей модель от google, gemini 2.0 flash.

Показать как распознает накладные я не могу, так как там присутствуют реквизиты клиента и его контрагентов, а вот для задачи распознавания водительских удостоверений я подобрал несколько примеров из интернета.

Для простоты я покажу все в боте, а так у данного сервиса есть свое API и отправлять картинки на распознавание можно из любой системы, в том числе и 1С.

Категории:
 Разное

Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
Оставьте свое сообщение
Форум Миста, жизнь и работа — интервью со Станиславом Митичкиным
Как программист 1С стал ИТ-директором металлургического холдинга. Интервью с Евгением Панкратовым
Атомная синергия: как 1С ускоряет процессы в РОСАТОМ. Интервью с Заяной Ачиновой.
Основы бюджетирования и способы его автоматизации в 1С
Матвей Серёгин. Неочевидные возможности системы компоновки данных
Ринат Юлчурин. Опыт использования оптимизированного механизма реструктуризации (v2) на базе размером 36 терабайт
Светлана Морозова. Я тебя вижу: как считать тип личности собеседника и построить эффективную коммуникацию
Ася Окулова. Эффективные сопроводительные письма, которые сэкономят ваше время
Александр Чавалах. Разработка пользовательской документации
Сергей Крайнев. Разветвленная разработка на хранилищах и файлах поставки