Распознавание текста из изображений и PDF с помощью нейросетей Yandex Vision и 1С

09.08.22

Интеграция - WEB-интеграция

+37 –

Если вам нужно с помощью компьютерного зрения от Yandex быстро распознавать текст из документов и изображений, эта статья для вас!

Файлы

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование	Скачано	Купить файл	По подписке PRO
Распознавание текста из Изображений и PDF с помощью нейросетей Yandex Vision и 1С: .epf 8,41Kb 46	46	4 200 руб. Купить	5 SM Скачать

Вы можете заказать платную доработку или адаптацию этой разработки под вашу конфигурацию на «Бирже заказов».

0% комиссии — оплата напрямую исполнителю;
Исполнители любого масштаба — от отдельных специалистов до команд под проект;
Прямой обмен контактами между заказчиком и исполнителем;
Безопасная сделка — при необходимости;
Рейтинги, кейсы и прозрачная система откликов.

Когда-то 5 лет назад я написал статью Распознавание текста с помощью нейросетей Google Cloud Vision и 1С

С тех пор многое поменялось, и я решил написать новую статью, используя отечественные технологии Yandex Cloud

Принцип работы получившейся обработки очень простой: нужно сделать POST запрос с картинкой или pdf на сервер Яндекса. Файл нужно закодировать в base64, и получить json-ответ.

И, разобрав ответ, программа может получить распознанный текст. Детальное описание возможностей Yandex Vision API можно посмотреть по ссылке. А про распознавание текста и формат запроса и ответа есть подробная документация

Работу с этим сервисом можно легко реализовать на 1С, используя только некоторые базовые вещи: HTTPЗапрос, ЧтениеJSON, ЗаписьJSON, что я и сделал. Внешнюю обработку можно использовать, только нужно получить в консоли Яндекс.Облака ключ для запросов, вот документация

Далее технические подробности:

Начнем с правильного формирования JSON запроса. Для этого, пользуясь описанием формата из документации, подготовим Структуру и сериализуем её в JSON.

Кстати обратите внимание что здесь я ставлю в массив language_codes только русский язык, но в этот массив можно добавить еще и "en" строку.

В запрос HTTP вставьте заголовок с ключом АПИ

Полученный ответ тоже можно сериализовать в структуру и извлечь из нее все распознанные блоки текста

Запустим обработку, закинем какую-нибудь картинку, полюбуемся полученным ответом.

Для примера распознавания PDF я взял первый попавшийся в поиске образец файла счета, и вот что получилось:

Мы только что заставили огромные сервера Яндекса и их мощные нейросети распознать нам текст, здорово, правда?

У Яндекса есть ограничения: Поддерживаемые форматы файлов: JPEG, PNG, PDF. Максимальный размер файла: 1 МБ.

Тарификация 130 рублей за 1000 изображений

Для распознавания паспорта есть отдельный запрос на стадии Preview но я этим не пользовался.

Тестировал на платформе 8.3.16

В обработке код открыт, можно ее скачать и использовать.

Вступайте в нашу телеграмм-группу Инфостарт

OCR распознавание текста документов компьютерное зрение

+37 –

См. также

Интеграция 1С с API Boxberry, СДЭК, Энергия, Почта России, DPD, ПЭК, Grastin, Деловые Линии, КСЕ, Dalli, ЯндексДоставка

WEB-интеграция Рабочее место Оптовая торговля Розничная торговля Логистика, склад и ТМЦ Пользователь 1С:Предприятие 8 1С:Бухгалтерия 2.0 1С:Бухгалтерия 3.0 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 1.6 1С:Управление нашей фирмой 3.0 1С:Управление торговлей 10 1С:Управление торговлей 11 1С:Розница 2 1С:Розница 3.0 Оптовая торговля, дистрибуция, логистика Россия Управленческий учет Платные (руб)

Программный продукт "Управление доставками в 1С" позволяет обмениваться с личным кабинетом Boxberry, СДЭК, Энергия, Почта России, DPD, ПЭК, Grastin, Деловые Линии, КСЕ, Dalli, ЯндексДоставка. Упрощает создание заявок и резервирование заказов прямо в интерфейсе 1С

24400 руб.

10.03.2016 74000 316 100

Распознавание и загрузка документов в 1С

Загрузка и выгрузка в Excel Учет документов Распознавание документов и образов Бухгалтер Пользователь 1С:Предприятие 8 1С 8.3 1С 8.5 1С:Комплексная автоматизация 1.х 1С:Бухгалтерия 2.0 1С:Управление торговлей 10 1С:Розница 2 1С:Управление производственным предприятием 1С:Управление нашей фирмой 1.6 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Управление холдингом 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 Бухгалтерский учет Управленческий учет Платные (руб)

Программа для распознавания сканов или фотографий товарных документов в 1С. Просто выбираете файл (PDF, XML, JPG, DOC, XLS, HTML) и нажимаете кнопку "Распознать и загрузить".

8540 руб.

04.06.2019 125589 373 183

369

Когда много сканов: Автоматическое прикрепление сканированных документов

Учет документов Распознавание документов и образов Бухгалтер Пользователь 1С:Предприятие 8 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х Россия Платные (руб)

Одна из наиболее удобных обработок автоматического прикрепления большого количества документов-оригиналов к документам 1С. Для файлов поточного сканирования автоматически определяются начало и конец каждого документа. Поддерживаются штрихкоды, QR-коды, отсканированные PDF документы без штрихкодов, сформированные в ЭДО текстовые PDF документы. Поддерживаются входящие и исходящие документы-оригиналы.

87108 руб.

23.12.2021 16967 33 25

Интеграция Vetmanager с 1С: автоматизация учета для ветеринарных клиник. Синхронизация документов, справочников и оплат через API

WEB-интеграция Программист 1С:Предприятие 8 1С:Бухгалтерия 3.0 Бытовые услуги, сервис Платные (руб)

Расширение для автоматизации передачи данных между сервисом Vetmanager с 1С: Бухгалтерия 3.0. Решение позволяет загружать документы и справочники из Ветменеджер в 1С:Бухгалтерию, сокращая время на ручной ввод данных и минимизируя ошибки.

24000 руб.

02.02.2021 23602 73 52

Amocrm: интеграция с 1С

WEB-интеграция Анализ продаж Системный администратор Программист Пользователь 1С:Предприятие 8 1С:Розница 2 1С:Управление нашей фирмой 1.6 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 1С:Розница 3.0 Управленческий учет Платные (руб)

Модуль "Подсистема интеграции AmoCRM с 1С" позволяет обеспечить единое информационное пространство, в котором пользователи могут эффективно управлять клиентской базой, следить за статусами сделок и поддерживать актуальность данных как в AmoCRM, так и в 1С.

60000 руб.

07.05.2019 43765 76 45

Интеграция Альфа Авто 5 и 6 и AUTOCRM + LOGICSTARS

Сайты и интернет-магазины WEB-интеграция Системный администратор Программист Пользователь 1С:Предприятие 8 1C:Бухгалтерия 1С:Управление торговлей 11 Автомобили, автосервисы Россия Управленческий учет Платные (руб)

Интеграционный модуль обмена между конфигурацией Альфа Авто 5 и Альфа Авто 6 и порталом AUTOCRM / LOGICSTARS. Данный модуль универсален. Позволяет работать с несколькими обменами AUTOCRM / LOGICSTAR разных брендов в одной информационной базе в ручном и автоматическом режиме.

42700 руб.

03.08.2020 24935 38 26

Интеграция 1С с OpenCart 2.x, 3x модуль обмена данными

WEB-интеграция Оптовая торговля Розничная торговля Программист 1С:Предприятие 8 1С:Розница 2 1С:Управление нашей фирмой 1.6 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 Розничная и сетевая торговля (FMCG) Оптовая торговля, дистрибуция, логистика Управленческий учет Платные (руб)

Модуль интеграции 1С с OpenCart 2.x, 3x позволяет обмениваться данными между OpenCart (самая популярная бесплатная cms для интернет-магазинов) и 1С:Предприятие 8.

6914 руб.

17.11.2015 133643 473 143

255

Экспортер — автоматизация выгрузки данных из 1С в Spot2D

WEB-интеграция Программист Бизнес-аналитик 1С:Предприятие 8 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 1С:Розница 3.0 Оптовая торговля, дистрибуция, логистика ИТ-компания Платные (руб)

Модуль "Экспортер" — это расширение для 1С, предназначенное для автоматизации процессов выгрузки данных. Оно позволяет эффективно извлекать, преобразовывать и передавать данные из систем 1С в интеграционную платформу Spot2D. Подсистема упрощает настройку, снижает количество ручных операций и обеспечивает удобный контроль данных.

17568 руб.

20.12.2024 6906 28 4

Комментарии

Подписаться на ответы Инфостарт бот

Свернуть все

1. Lemmonbri 176 18.07.22 15:52 Сейчас в теме

10 стартмани за 100 строк кода, 90 из которых скопированы из документации яндекса? Сильно, сильно...

Ответить

2. gzharkoj 596 18.07.22 22:06 Сейчас в теме

(1) Так весь код приведен,берите да вбивайте. Причем формирование всех заголовков указано для http-запроса, что у новичков может вызвать проблемы.

3. CnupT 70 19.07.22 10:39 Сейчас в теме

В целом, идея нужная и полезная. Но что делать со счетом на оплату, пришедшем к нам вот в таком виде, как на картинке?
Это же просто перечисление всех слов, встреченных на листочке

Ответить

4. vlaskin 83 20.07.22 15:51 Сейчас в теме

Есть бюджетные решения и платить никому не нужно https://infostart.ru/public/1557184/. Не я автор, но использовал в работе (предварительно адаптировав): загрузка из скана наряда на бригаду строителей в ЗУП в разовое начисление списка сотрудников и сумму. решение получается автономное.

5. rog87@yandex.ru 1 04.02.23 18:55 Сейчас в теме

Отличная статья. Огромный потенциал.
Единственное в обработке ответа не хватает перевода строк на новую строку:

	
Текст = "";
	для Каждого Блок из Блоки Цикл 
		Линии = Блок.lines;
		Для Каждого Линия из Линии Цикл
			Слова = Линия.words;
			Для Каждого Слово из Слова Цикл 
				стр = Слово.text;
				Текст = Текст + стр + " ";
			КонецЦикла;	
			Текст = Текст + ";";
		КонецЦикла;
		Текст = Текст + Символы.ПС;
	КонецЦикла;
	РезультатСтрока = Текст;

Показать

6. Skellar 27 25.02.25 11:36 Сейчас в теме

Попробовал запустить - ошибка 301 и Expected a value.{"analyzeSpecs"^. У Яндекса что-то поменялось?

7. userud 04.07.25 11:05 Сейчас в теме

(6) Да, неактуальная обработка уже.

8. AlexeyShiganov 24.10.25 15:28 Сейчас в теме

&НаКлиенте
Процедура Преобразовать(Команда)
НС = Элементы.ФайлыВКаталоге.ТекущиеДанные;
Апи = "ocr.api.cloud.yandex.net";
МетодАпи = "/ocr/v1/recognizeText";
КлючАПИуСервисногоАккаунта = "123";
НашID = Новый УникальныйИдентификатор();

НС.СостояниеРаспознавания = "Идет распознавание";
НС.СчетчикОтправкиНаРаспознавание = НС.СчетчикОтправкиНаРаспознавание + 1;
НС.ИдентификаторОперацииРаспознавания = НашID;
НС.СообщениеОбОшибке = Неопределено;
НС.РезультатРаспознавания = Неопределено;
НС.РезультатРаспознаванияЧитабельный = Неопределено;

ЗаголовокЗапросаHTTP = Новый Соответствие();
ЗаголовокЗапросаHTTP.Вставить("Content-Type", "application/json");
ЗаголовокЗапросаHTTP.Вставить("Authorization", "Api-Key " + КлючАПИуСервисногоАккаунта);
ЗаголовокЗапросаHTTP.Вставить("x-data-logging-enabled", true); //Подробнее тут https://yandex.cloud/ru/docs/vision/api-ref/support-headers
ЗаголовокЗапросаHTTP.Вставить("x-client-request-id", НашID);

ИнетЗапрос = Новый HTTPЗапрос(МетодАпи, ЗаголовокЗапросаHTTP);

ТелоЗапроса = Новый ЗаписьJSON;
ТелоЗапроса.УстановитьСтроку();
КореньЗапроса = Новый Структура;
Если СтрНайти (НС.РасширениеФайла, ".pdf") > 0 Тогда
КореньЗапроса.Вставить("mimeType", "application/pdf");
Иначе
КореньЗапроса.Вставить("mimeType", "image/jpeg");
КонецЕсли;
languageCodes = Новый Массив;
//languageCodes.Добавить("*"); //Не работает
languageCodes.Добавить("ru");
languageCodes.Добавить("en");
КореньЗапроса.Вставить("languageCodes", languageCodes);
//КореньЗапроса.Вставить("model", "handwritten"); //handwritten стоит 1.5 руб/страница
КореньЗапроса.Вставить("model", "page-column-sort");
ДвоичныеДанные = Новый ДвоичныеДанные(НС.ПолныйПутьФайла);
Объектbase64 = Base64Строка(ДвоичныеДанные);
КореньЗапроса.Вставить("content", Объектbase64);
ЗаписатьJSON(ТелоЗапроса, КореньЗапроса);
ДанныеТела = ТелоЗапроса.Закрыть();
ИнетЗапрос.УстановитьТелоИзСтроки(ДанныеТела);
ssl = Новый ЗащищенноеСоединениеOpenSSL;
ИмяВремФайлаОтвета = ПолучитьИмяВременногоФайла("json");
Соединение = новый HTTPСоединение(Апи,,,,,,ssl);
Соединение.ОтправитьДляОбработки(ИнетЗапрос, ИмяВремФайлаОтвета);
ЧтениеТек = новый ЧтениеТекста(ИмяВремФайлаОтвета);

ОтветЯндекс = Чтениетек.Прочитать();
ЧтениеОтвета = Новый ЧтениеJSON;
ЧтениеОтвета.ОткрытьФайл(ИмяВремФайлаОтвета);
Структура = ПрочитатьJSON(ЧтениеОтвета);
ЧтениеОтвета.Закрыть();

Если ЕстьРеквизитИлиСвойствоОбъекта(Структура, "Error") Тогда
НС.СообщениеОбОшибке = ОтветЯндекс;
НС.СостояниеРаспознавания = "Ошибка распознавания";
Иначе
НС.РезультатРаспознавания = ОтветЯндекс;
НС.СостояниеРаспознавания = "Завершено распознавание";

ИтоговыйТекст = "";
Попытка
ИтоговыйТекст = СтрЗаменить(Структура.result.textAnnotation.fullText, "\n", Символы.ПС);
Исключение
ИтоговыйТекст = "Ошибка при преобразовании JSON результата распознавания" + Символы.ПС + ПодробноеПредставлениеОшибки(ИнформацияОбОшибке());
КонецПопытки;
ИтоговыйТекст = СокрЛП(ИтоговыйТекст);

НС.РезультатРаспознаванияЧитабельный = ИтоговыйТекст;
КонецЕсли;

КонецПроцедуры

Показать

(6)

9. svetlitsky_sv 11.04.26 22:19 Сейчас в теме

большое спасибо. Приведенный пример сразу заработал. Подключил deepseek и сейчас склад распознает УПД и накладные за копейки. Очень удобный сервис

10. svetlitsky_sv 19.04.26 13:22 Сейчас в теме

Добавлю, кому интересно - описание, которое указано в публикации устарело, но работает с какой-то частью документов. Сейчас у сервиса реализована асинхронная обработка документов (в два запроса, если через REST). Посидел несколько вечеров - сделал на базе Yandex vision и deepseek api сервис распознавания любых документов. Понятно, что без излишних наворотов, но денежку организации экономит. Сервер на своей стороне (с возможностью роста плюшек) и обработка на стороне бухгалтерии. Все на 1С. Стоимость структурированного json получается около 25-35 копеек за страницу документа. Можно без deepseek, на локальной llm - будет в два раза дешевле :) Сейчас допиливаю сопряжение номенклатуры. Кому интересно - пишите в личку

Для отправки сообщения требуется регистрация/авторизация

Автор:

Иван Коротеев (kiv1c)

Рейтинг: 818

Вы можете заказать платную консультацию или разработку у автора. Будет создан приватный заказ на «Бирже заказов» для автора.

Публикация:

№ 1693700

Создание 13.07.22 12:30

Обновление 09.08.22 17:03

Статистика:

Просмотры 23624

Загрузки 46

Рейтинг 37

Комментарии 10

Характеристики:

Код открыт Да

Рубрики WEB-интеграция Распознавание документов и образов

Кому Программист

Тип файла Внешняя обработка (ert,epf)

Платформа 1С:Предприятие 8

Конфигурация 1C:Бухгалтерия

Операционная система Не имеет значения

Страна Не имеет значения

Отрасль Не имеет значения

Налоги Не имеет значения

Вид учета Не имеет значения

Доступ к файлу Абонемент ($m)

Распознавание текста из изображений и PDF с помощью нейросетей Yandex Vision и 1С

Файлы

См. также

Журнал

База знаний

Лаборатория

Анализ & Управление

Сопровождение 1С

Корпоративные решения

Обучение

Маркетплейс

Проектный офис

Мероприятия

Видеозаписи

Биржа заказов

Форум

Мерч

О компании