Распознавание текста из изображений и PDF с помощью нейросетей Yandex Vision и 1С

09.08.22

Интеграция - WEB-интеграция

Если вам нужно с помощью компьютерного зрения от Yandex быстро распознавать текст из документов и изображений, эта статья для вас!

Скачать файлы

Наименование Файл Версия Размер
Распознавание текста из Изображений и PDF с помощью нейросетей Yandex Vision и 1С:
.epf 8,41Kb
23
.epf 8,41Kb 23 Скачать

Когда-то 5 лет назад я написал статью Распознавание текста с помощью нейросетей Google Cloud Vision и 1С

С тех пор многое поменялось, и я решил написать новую статью, используя отечественные технологии Yandex Cloud

Принцип работы получившейся обработки очень простой: нужно сделать POST запрос с картинкой или pdf на сервер Яндекса. Файл нужно закодировать в base64, и получить json-ответ.

И, разобрав ответ, программа может получить распознанный текст. Детальное описание возможностей Yandex Vision API можно посмотреть по ссылке. А про распознавание текста и формат запроса и ответа есть подробная документация

Работу с этим сервисом можно легко реализовать на 1С, используя только некоторые базовые вещи: HTTPЗапрос, ЧтениеJSON, ЗаписьJSON, что я и сделал. Внешнюю обработку можно использовать, только нужно получить в консоли Яндекс.Облака ключ для запросов, вот документация

 

 

Далее технические подробности:

Начнем с правильного формирования JSON запроса. Для этого, пользуясь описанием формата из документации, подготовим Структуру и сериализуем её в JSON.

Кстати обратите внимание что здесь я ставлю в массив language_codes только русский язык, но в этот массив можно добавить еще и "en" строку.

 

 

В запрос HTTP вставьте заголовок с ключом АПИ

 

 

Полученный ответ тоже можно сериализовать в структуру и извлечь из нее все распознанные блоки текста

 

 

Запустим обработку, закинем какую-нибудь картинку, полюбуемся полученным ответом.

 

 

Для примера распознавания PDF я взял первый попавшийся в поиске образец файла счета, и вот что получилось:

 

 

Мы только что заставили огромные сервера Яндекса и их мощные нейросети распознать нам текст, здорово, правда?

У Яндекса есть ограничения: Поддерживаемые форматы файлов: JPEG, PNG, PDF. Максимальный размер файла: 1 МБ.

Тарификация 130 рублей за 1000 изображений

Для распознавания паспорта есть отдельный запрос на стадии Preview но я этим не пользовался.

Тестировал на платформе 8.3.16

В обработке код открыт, можно ее скачать и использовать. 

OCR распознавание текста документов компьютерное зрение

См. также

Интеграция Альфа Авто 5 / Альфа Авто 6 и AUTOCRM / Инфотек

Сайты и интернет-магазины WEB-интеграция Платформа 1С v8.3 Конфигурации 1cv8 1С:Управление торговлей 11 Автомобили, автосервисы Россия Управленческий учет Платные (руб)

Интеграционный модуль обмена между конфигурацией Альфа Авто 5 и Альфа Авто 6 и порталом AUTOCRM. Данный модуль универсален. Позволяет работать с несколькими обменами AUTOCRM разных брендов в одной информационной базе в ручном и автоматическом режиме.

36000 руб.

03.08.2020    15745    10    17    

11

SALE! 30%

Распознавание и загрузка сканов в 1С "одним нажатием": УПД, ТОРГ-12, накладные, счета, номенклатура, заказы и т.д.

Загрузка и выгрузка в Excel Документооборот и делопроизводство (СЭД) Учет документов Распознавание документов и образов Управляемые формы 1С:Комплексная автоматизация 1.х 1С:Бухгалтерия 2.0 1С:Управление торговлей 10 1С:Розница 2 1С:Управление производственным предприятием 1С:Управление нашей фирмой 1.6 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Управление холдингом 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 Бухгалтерский учет Управленческий учет Платные (руб)

Универсальная программа для распознавания ЛЮБЫХ СКАНОВ ИЛИ ФОТО ТОВАРНЫХ ДОКУМЕНТОВ в 1С. Не требует указания параметров и предварительной настройки. Просто выбираете файл (PDF, JPG, DOC, XLS, HTML и т.д.) выбираете документ 1С и нажимаете кнопку "Распознать и загрузить".

6000 5520 руб.

04.06.2019    101374    296    173    

312

Интеграция 1С — Битрикс24. Обмен задачами

Сайты и интернет-магазины Интеграция WEB-интеграция Платформа 1С v8.3 Конфигурации 1cv8 Управленческий учет Платные (руб)

Интеграция 1С и Битрикс24. Разработка имеет двухстороннюю синхронизацию 1С и Битрикс24 задачами. Решение позволяет создавать пользователя в 1С из Битрикс24 и наоборот. Данная разработка технически подходит под все основные конфигурации линейки продуктов 1С:Предприятие 8.3 (8.3.18.1289). При приобретении предоставляется 1 месяц бесплатных обновлений разработки. Доступна демо-версия продукта с подключением Вашего Битрикс24

5040 руб.

04.05.2021    17548    6    15    

13

Интеграция с сервисом vetmanager

WEB-интеграция Платформа 1С v8.3 Бухгалтерский учет 1С:Бухгалтерия 3.0 Бытовые услуги, сервис Платные (руб)

Внешняя обработка разрабатывалась для загрузки документов из Ветменеджер в 1С: Бухгалтерия 3.0

12000 руб.

02.02.2021    16359    42    49    

23

Распознавание номеров автомашин с ip - камер, видео, фото

Распознавание документов и образов Периферийные устройства Автомобили, автосервисы Россия Платные (руб)

Программа считывает кадры с ip-камер (http - запрос к камере), видео, фото (источники кадров (нет ограничения на их количество) настраивается в конфигурационном файле), находит и распознает номера автомашин и сохраняет в базу db, с сохранением фото номера и автомашины, а также времени детекции.

20400 руб.

31.05.2023    3800    2    1    

3
Комментарии
В избранное Подписаться на ответы Сортировка: Древо развёрнутое
Свернуть все
1. Lemmonbri 116 18.07.22 15:52 Сейчас в теме
10 стартмани за 100 строк кода, 90 из которых скопированы из документации яндекса? Сильно, сильно...
smit1c; lunjio; GATTUSO; Dach; Mouros; myoker; tsmult; tsugancov; +8 1 Ответить
2. gzharkoj 502 18.07.22 22:06 Сейчас в теме
(1) Так весь код приведен,берите да вбивайте. Причем формирование всех заголовков указано для http-запроса, что у новичков может вызвать проблемы.
3. CnupT 69 19.07.22 10:39 Сейчас в теме
В целом, идея нужная и полезная. Но что делать со счетом на оплату, пришедшем к нам вот в таком виде, как на картинке?
Это же просто перечисление всех слов, встреченных на листочке
tpkpsd; UnashevRM; tsugancov; noprogrammer; SerVer1C; +5 Ответить
4. vlaskin 82 20.07.22 15:51 Сейчас в теме
Есть бюджетные решения и платить никому не нужно https://infostart.ru/public/1557184/. Не я автор, но использовал в работе (предварительно адаптировав): загрузка из скана наряда на бригаду строителей в ЗУП в разовое начисление списка сотрудников и сумму. решение получается автономное.
5. rog87@yandex.ru 1 04.02.23 18:55 Сейчас в теме
Отличная статья. Огромный потенциал.
Единственное в обработке ответа не хватает перевода строк на новую строку:
	
Текст = "";
	для Каждого Блок из Блоки Цикл 
		Линии = Блок.lines;
		Для Каждого Линия из Линии Цикл
			Слова = Линия.words;
			Для Каждого Слово из Слова Цикл 
				стр = Слово.text;
				Текст = Текст + стр + " ";
			КонецЦикла;	
			Текст = Текст + ";";
		КонецЦикла;
		Текст = Текст + Символы.ПС;
	КонецЦикла;
	РезультатСтрока = Текст;
Показать
Оставьте свое сообщение