Распознавание текста из изображений и PDF с помощью нейросетей Yandex Vision и 1С

Публикация № 1693700 13.07.22

Задачи пользователя - Обработка документов

OCR распознавание текста документов компьютерное зрение

Если вам нужно с помощью компьютерного зрения от Yandex быстро распознавать текст из документов и изображений, эта статья для вас!

Когда-то 5 лет назад я написал статью Распознавание текста с помощью нейросетей Google Cloud Vision и 1С

С тех пор многое поменялось, и я решил написать новую статью, используя отечественные технологии Yandex Cloud

Принцип работы получившейся обработки очень простой: нужно сделать POST запрос с картинкой или pdf на сервер Яндекса. Файл нужно закодировать в base64, и получить json-ответ.

И, разобрав ответ, программа может получить распознанный текст. Детальное описание возможностей Yandex Vision API можно посмотреть по ссылке. А про распознавание текста и формат запроса и ответа есть подробная документация

Работу с этим сервисом можно легко реализовать на 1С, используя только некоторые базовые вещи: HTTPЗапрос, ЧтениеJSON, ЗаписьJSON, что я и сделал. Внешнюю обработку можно использовать, только нужно получить в консоли Яндекс.Облака ключ для запросов, вот документация

 

 

Далее технические подробности:

Начнем с правильного формирования JSON запроса. Для этого, пользуясь описанием формата из документации, подготовим Структуру и сериализуем её в JSON.

Кстати обратите внимание что здесь я ставлю в массив language_codes только русский язык, но в этот массив можно добавить еще и "en" строку.

 

 

В запрос HTTP вставьте заголовок с ключом АПИ

 

 

Полученный ответ тоже можно сериализовать в структуру и извлечь из нее все распознанные блоки текста

 

 

Запустим обработку, закинем какую-нибудь картинку, полюбуемся полученным ответом.

 

 

Для примера распознавания PDF я взял первый попавшийся в поиске образец файла счета, и вот что получилось:

 

 

Мы только что заставили огромные сервера Яндекса и их мощные нейросети распознать нам текст, здорово, правда?

У Яндекса есть ограничения: Поддерживаемые форматы файлов: JPEG, PNG, PDF. Максимальный размер файла: 1 МБ.

Тарификация 130 рублей за 1000 изображений

Для распознавания паспорта есть отдельный запрос на стадии Preview но я этим не пользовался.

Тестировал на платформе 8.3.16

В обработке код открыт, можно ее скачать и использовать. 

Скачать файлы

Наименование Файл Версия Размер
Распознавание текста из Изображений и PDF с помощью нейросетей Yandex Vision и 1С:

.epf 8,41Kb
9
.epf 8,41Kb 9 Скачать

Специальные предложения

Комментарии
В избранное Подписаться на ответы Сортировка: Древо развёрнутое
Свернуть все
1. Lemmonbri 2 18.07.22 15:52 Сейчас в теме
10 стартмани за 100 строк кода, 90 из которых скопированы из документации яндекса? Сильно, сильно...
smit1c; lunjio; GATTUSO; Dach; Mouros; myoker; tsmult; tsugancov; +8 1 Ответить
2. gzharkoj 467 18.07.22 22:06 Сейчас в теме
(1) Так весь код приведен,берите да вбивайте. Причем формирование всех заголовков указано для http-запроса, что у новичков может вызвать проблемы.
3. CnupT 70 19.07.22 10:39 Сейчас в теме
В целом, идея нужная и полезная. Но что делать со счетом на оплату, пришедшем к нам вот в таком виде, как на картинке?
Это же просто перечисление всех слов, встреченных на листочке
UnashevRM; tsugancov; noprogrammer; SerVer1C; +4 Ответить
4. vlaskin 82 20.07.22 15:51 Сейчас в теме
Есть бюджетные решения и платить никому не нужно https://infostart.ru/public/1557184/. Не я автор, но использовал в работе (предварительно адаптировав): загрузка из скана наряда на бригаду строителей в ЗУП в разовое начисление списка сотрудников и сумму. решение получается автономное.
5. rog87@yandex.ru 04.02.23 18:55 Сейчас в теме
Отличная статья. Огромный потенциал.
Единственное в обработке ответа не хватает перевода строк на новую строку:
	
Текст = "";
	для Каждого Блок из Блоки Цикл 
		Линии = Блок.lines;
		Для Каждого Линия из Линии Цикл
			Слова = Линия.words;
			Для Каждого Слово из Слова Цикл 
				стр = Слово.text;
				Текст = Текст + стр + " ";
			КонецЦикла;	
			Текст = Текст + ";";
		КонецЦикла;
		Текст = Текст + Символы.ПС;
	КонецЦикла;
	РезультатСтрока = Текст;
Показать
Оставьте свое сообщение

См. также

Заполнение контрагентов по ИНН для УТ 10.3

Обработка справочников WEB-интеграция Платформа 1С v8.3 1С:Управление торговлей 10 Россия Абонемент ($m)

Заполнение контрагентов по ИНН (1С: Управление торговлей 10.3).

6 стартмани

17.05.2022    5709    35    kostyan7    20    

1

Перепроведение документов с контролем проводок

Обработка документов Платформа 1С v8.3 Бухгалтерский учет Конфигурации 1cv8 Бухгалтерский учет Абонемент ($m)

Немного переделанная стандартная обработка «Проведение документов», контролирует проводки документов и если они изменились — сообщает об этом.

1 стартмани

05.06.2021    11007    15    AnryMc    0    

10

BIM: взаимодействие с платформой Autodesk Forge

WEB-интеграция Платформа 1С v8.3 Конфигурации 1cv8 Строительство Абонемент ($m)

Предлагаемый пример демонстрирует широкие возможности для взаимодействия «1С:Предприятие» с платформой Autodesk Forge и позволяет вам получить базовые представления о применения технологий информационного моделирования в строительстве. Поддерживаются все версии платформы от 8.3.12 и выше до 8.3.18.

1 стартмани

25.11.2020    77811    16    kandr    3    

6

Связанные документы или Структура подчиненности (КА 2.4, ERP 2, УТ 11)

Обработка документов Платформа 1С v8.3 1С:ERP Управление предприятием 2 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х Управленческий учет Абонемент ($m)

В форму структуры подчиненности документов добавлены кнопки проведения, отмены проведения и пометки на удаление. Также красным подсвечены поступления денег и синим списания.

1 стартмани

13.07.2020    22768    27    silver_jr    1    

5

Программы для исполнения 488-ФЗ: Маркировка товаров Промо

1 января 2019 года вступил в силу ФЗ от 25.12.2018 № 488-ФЗ о единой информационной системе маркировки товаров с использованием контрольных (идентификационных) знаков, который позволяет проследить движение товара от производителя до конечного потребителя. Инфостарт предлагает подборку программ, связанных с применением 488-ФЗ и маркировкой товаров.

Конвертация любых адресов, написанных в свободной форме, к ФИАС

WEB-интеграция Платформа 1С v8.3 Конфигурации 1cv8 Россия Абонемент ($m)

Допустим у нас есть база с адресами клиентов, и написаны они могут быть как душе угодно. С опечатками, без индексов, без разделителей, в совершенно любом формате. Вот было бы здорово иметь функцию, которая одним нажатием кнопки преобразует любую белиберду к строгому представлению адреса по ФИАС? Восстановит индекс, исправит опечатки и вернёт на 100% валидный адрес. Для всех, кто мечтательно сказал "ДА!", выкладываю данную обработку.

2 стартмани

30.06.2020    17469    140    XilDen    19    

28

Модуль обмена с QIWI

Банковские операции WEB-интеграция Платформа 1С v8.3 Конфигурации 1cv8 Управленческий учет Абонемент ($m)

Компании, которые используют систему моментальных платежей QIWI, ценят ее за удобство по скорости выплат и для платежей по запросу. Но такие переводы сложны для учета, а при большом объеме проводимых операций отнимают много времени и превращаются в дополнительную головную боль. Мы сотрудничали с компаниями, которые отправляют большое количество платеже на QIWI, и часто слышали боль бухгалтеров о том, как им сложно работать с такими переводами. Поэтому мы автоматизировали выплаты через QIWI в 1С и создали модуль интеграции 1С c API QIWI Wallet и QIWI TopUp.

5 стартмани

25.05.2020    15505    3    Neti    10    

16

"Учет штрафов ГИБДД" с возможной загрузкой из открытых источников в интернет Расширение конфигурации 1С: Предприятие 8.3

Обработка документов WEB-интеграция Платформа 1С v8.3 Управляемые формы Конфигурации 1cv8 Россия Бухгалтерский учет Управленческий учет Абонемент ($m)

Расширение конфигурации Бухгалтерия предприятия, редакция 3.0 (при минимальных изменениях любой типовой конфигурации), позволяющее вести историю данных по штрафам ГИБДД для справочника транспортных средств компании. Бонусом поставляется внешняя обработка, способная загружать эти данные из открытых источников в интернет.

4 стартмани

30.12.2019    30320    43    capitan    30    

1

Односторонний файловый обмен с сайтом по ftp (1C 2 Web)

Файловый обмен (TXT, XML, DBF), FTP WEB-интеграция Платформа 1С v8.3 1С:Розница 1С:Управление нашей фирмой 1.6 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х 1С:Зарплата и Управление Персоналом 3.x Абонемент ($m)

Подходит под любую конфигурацию на управляемом интерфейсе на базе БСП 2.4.4 и выше. Позволяет гибко настроить выгрузку, практически любых, данных по расписанию на сервер ftp вашего ресурса. Ведение лога процесса выгрузки также предусмотрено.

3 стартмани

09.12.2019    21415    25    LamerSoft    0    

19

Пакетное пробитие чеков на Онлайн-кассе при оплатах от физических лиц на расчетный счет

Банковские операции Кассовые операции Обработка документов Платформа 1С v8.3 Бухгалтерский учет 1С:Бухгалтерия 3.0 Россия Бухгалтерский учет Абонемент ($m)

Автоматизация процесса пробития чеков онлайн при поступлениях на расчетный счет от физических лиц. Помогает сократить трудозатраты таким организациям, как МФЦ, Управляющие компании и т.д. Подходит для 1С:Бухгалтерия 3.0 любой версии (базовая, ПРОФ, КОРП). Не изменяет конфигурацию. Конфигурация остается на поддержке (типовая).

2 стартмани

24.09.2019    33412    18    r.resh39    16    

13

Программы для исполнения 54-ФЗ Промо

С 01.02.2017 контрольно-кассовая техника должна отправлять электронные версии чеков оператору фискальных данных - правила установлены в 54-ФЗ ст.2 п.2. Инфостарт предлагает подборку программ, связанных с применением 54-ФЗ, ККТ и электронных чеков.

Аванс с проверкой невыходов (Расширение для ЗУП 3.1 и ЗКГУ 3.1)

Обработка документов Зарплата Платформа 1С v8.3 Сложные периодические расчеты 1С:Зарплата и кадры государственного учреждения 3 1С:Зарплата и Управление Персоналом 3.x Россия Бухгалтерский учет Абонемент ($m)

Проверка перед выплатой аванса в документе "Ведомость в банк" и "Ведомость в кассу" по отсутствующим сотрудникам. Тестировал на платформе 1С:Предприятие 8.3 (8.3.15.1489), конфигурации Зарплата и управление персоналом, редакция 3.1 (3.1.10.78) и Зарплата и кадры государственного учреждения, редакция 3.1 (3.1.10.78)

2 стартмани

26.07.2019    15245    55    APTEM_SLV    43    

8

Списание (корректировка) задолженности контрагентов УНФ 1.6

Взаиморасчеты Обработка документов Закрытие периода Корректировка данных Платформа 1С v8.3 1С:Управление нашей фирмой 1.6 Украина Бухгалтерский учет Абонемент ($m)

Обнуление задолженности контрагентов в конфигурации "Управление небольшой (нашей) фирмой" версии 1.6 с помощью документа "Корректировка регистров".

1 стартмани

24.07.2019    42280    35    DMon    1    

9

Регистрация документов с измененной суммой

Обработка документов Платформа 1С v8.3 Конфигурации 1cv8 Абонемент ($m)

Обработка берет информацию из истории изменения документов. Удобна для администраторов, когда документы с измененной суммой по какой-то причине не регистрируются в плане обменов. Можно регистрировать не все документы, а только те, которые были изменены.

1 стартмани

20.04.2019    34887    9    ryan    0    

5

Валовая прибыль для УПП 1.3, КА 1.1 в режиме РАУЗ (работа типового отчета без доработок конфигурации)

Обработка документов Платформа 1С v8.3 1С:Комплексная автоматизация 1.х 1С:Управление производственным предприятием Управленческий учет Абонемент ($m)

Простое и мгновенное решение для использования типового отчета "Валовая прибыль" в конфигурациях "Управление производственным предприятием 1.3", "Комплексная автоматизация 1.1" (а также отраслевых решений на их базе) при включенном режиме РАУЗ (расширенная аналитика учета затрат). Не требует настройки или изменения конфигурации, либо может быть, для дополнительного удобства, интегрировано в нее с минимальными доработками.

2 стартмани

21.01.2019    37093    45    stvorl    12    

8

1СПАРК РИСКИ. Сервис оценки благонадежности контрагентов. Промо

СПАРК помогает предотвратить мошенничество со стороны компаний и предпринимателей, благодаря актуальным сведениям о компаниях и системе выявления факторов риска.Сервис позволяет управлять налоговыми рисками и комплексно оценивать благонадежность контрагентов.

Проверка VAT номеров

WEB-интеграция Платформа 1С v8.3 Конфигурации 1cv8 Абонемент ($m)

Обработка для вызова сервиса проверка VAT номера.

1 стартмани

26.11.2018    26350    4    wtlz    1    

3

Помощник корректировки остатков ЕГАИС в небольшом магазине. Розница 2.2

Розничная торговля Обработка документов Обмен с ГосИС Корректировка данных Платформа 1С v8.3 1С:Розница Розничная и сетевая торговля (FMCG) Рестораны, кафе и фаст-фуд Россия Управленческий учет Абонемент ($m)

Данная обработка упрощает корректировку остатков алкогольной продукции небольшого магазина, где предполагается передача всей продукции в торговый зал сразу после приемки.

5 стартмани

08.09.2018    54433    85    asdfgcom    47    

12

Пример использования REST API Яндекс Диска

WEB-интеграция Платформа 1С v8.3 Конфигурации 1cv8 Абонемент ($m)

Пример использования REST API Яндекс Диска: чтение диска, добавление каталога, загрузка файла, скачивание файлов или каталогов, удаление файлов или каталогов.

1 стартмани

26.06.2018    46239    79    MKFreeUser    17    

49

Готовые переносы данных из различных конфигураций 1C Промо

Рекомендуем готовые решения для переноса данных из различных конфигураций 1C. C техподдержкой от разработчиков и гарантией от Инфостарт.

Обмен файловыми базами данных через Yandex диск

WEB-интеграция Платформа 1С v8.3 Россия Абонемент ($m)

Выполнение операций обмена с Yandex диском для файловых БД, по протоколу WebDav, в автоматическом или ручном режимах.

1 стартмани

11.06.2018    27558    8    slimper    1    

7

Внешняя компонента для работы по Web-socket протоколу x32 x64

Разработка внешних компонент WEB-интеграция Платформа 1С v8.3 Абонемент ($m)

Кто когда-нибудь сталкивался с обменом данными по Web-Socket (wss) протоколу из 1С, тому известно, что в платформе отсутствуют данные механизмы (не путать с HTTP запросами и WebServices). Предлагается использовать внешнюю компоненту, написанную по технологии NativeAPI, для подключения и обмена с серверами из 1С-Предприятия, работающими по протоколу Web-Socket.

2 стартмани

30.03.2018    48361    124    Ditron    120    

38

Построение маршрута доставки с расчётом расстояния для любой базы УФ

Универсальные обработки WEB-интеграция Оптовая торговля Платформа 1С v8.3 Управляемые формы Конфигурации 1cv8 Абонемент ($m)

Графическое изображение маршрутного листа по картам гугл. Работает на любой конфигурации с управляемыми формами. Использует новую версию api google-карт от 13.02.2018 года под IE11.

10 стартмани

24.02.2018    51408    47    KorotkovRV    17    

67

Корректировка остатков ЕГАИС, возврат из регистра 2, загрузка ТТН из файлов, другое для УТ10.3

Розничная торговля Обработка документов Обмен с ГосИС Корректировка данных Платформа 1С v8.3 Оперативный учет 1С:Управление торговлей 10 Россия Бухгалтерский учет Абонемент ($m)

Набор обработок для автоматизации работы с ЕГАИС: Обработка корректировки остатков ЕГАИС для УТ 10.3, аналогичная имеющимся в УТ 11, Рознице 2.2. Автоматически формирует документы "Передача в торговый зал", "Акт постановки на баланс в торговом зале", "Акт списания в торговом зале". Обработка возврата из регистра 2 с подбором справок Б. Обработка формирования ТТН из файлов xml.

1 стартмани

24.01.2018    56700    20    biz-intel    6    

15

Подборка решений для взаимодействия со ФГИС «Меркурий» Промо

С 1 июля 2019 года все компании, участвующие в обороте товаров животного происхождения, должны перейти на электронную ветеринарную сертификацию (ЭВС) через ФГИС «Меркурий». Инфостарт предлагает подборку программ, связанных с этим изменением.

Сервер push сообщений “Push0k“ 18.05

WEB-интеграция Платформа 1С v8.3 Конфигурации 1cv8 Абонемент ($m)

Аналог других “мессенджеров“. Позволяет практически все то же самое, что и другие решения. За исключением смайлов, эмодзи, голосовой и видео связи. Основное отличие от других решений, открыта и доступна для изменения серверная и клиентская часть месенджера. Общедоступной серверной части нет, за серверную часть отвечаете вы сами.

1 стартмани

19.12.2017    28607    15    PloAl    20    

14

Обнуление остатков и движений регистров накопления (УФ)

Чистка данных Обработка документов Логистика, склад и ТМЦ Платформа 1С v8.3 Управляемые формы Конфигурации 1cv8 Россия Управленческий учет Абонемент ($m)

Универсальная обработка обнуления регистров накопления (остатки и обороты) для любой* конфигурации под управляемые формы.

4 стартмани

01.12.2017    18461    87    aleksch21    7    

6

Копирование меню в Трактир Management

Обработка документов Производство готовой продукции (работ, услуг) Платформа 1С v8.3 Конфигурации 1cv8 Рестораны, кафе и фаст-фуд Россия Управленческий учет Абонемент ($m)

Механизм копирования меню в Трактир Management. Данная обработка расширяет функционал типового решения Трактир Management, позволяя быстро вводить в эксплуатацию новую точку путём создания нового меню на основании имеющегося.

1 стартмани

28.11.2017    44890    3    integrator1983    0    

2

Помощник по закрытию месяца для УТ 11.3

Обработка документов Закрытие периода Платформа 1С v8.3 Оперативный учет 1С:Управление торговлей 11 Россия Управленческий учет Абонемент ($m)

Помощник по закрытию месяца для УТ 11.3. Имеет две функции: обнуление товаров "К оформлению" в интеркампани и обнуление отрицательных остатков в регистре "Себестоимость товаров".

5 стартмани

10.11.2017    40336    17    Zalipaka    1    

26

Подсистема Вики - интеграция 1С и сайта под управлением MediaWiki

WEB-интеграция Платформа 1С v8.3 Абонемент ($m)

Редактирование статей сайта Mediawiki из 1С. Формирование функционального описания конфигурации на сайте Вики.

1 стартмани

19.09.2017    39346    38    shmalevoz    21    

102

Видеокурс-практикум: как подготовить и написать ТЗ, ЗНР, ЧТЗ. Промо

В курсе обобщен опыт работы аналитика на проектах в течение пяти лет, в нескольких фирмах. Подходы к написанию документов унифицированы и по возможности не привязаны к конфигурациям 1С.

3 500 рублей

Работа с картой. Кадастровый учет (Росреестр). Тематические карты

WEB-интеграция Рабочее место Платформа 1С v8.3 Управляемые формы Конфигурации 1cv8 Абонемент ($m)

Внешняя обработка для работы с картами в 1С. Получения изображения с публичной кадастровой карты России, построения тематических карт

10 стартмани

31.08.2017    33882    35    vipchep    12    

25

Упрощение работы с актами сверки в УТ/КА/УПП - вывод номеров счетов в документе и печатной форме

Обработка документов Печатные формы Взаиморасчеты Платформа 1С v8.3 1С:Комплексная автоматизация 1.х 1С:Управление торговлей 10 1С:Управление производственным предприятием Бухгалтерский учет Управленческий учет Абонемент ($m)

Обычно акт сверки с клиентами содержат информацию о документах реализации товаров (накладных) и выполненных платежах. Но платежи делаются на основании счетов, номера которых отсутствуют в актах, что затрудняет собственно сверку. Данная обработка находит соответствующие расходным накладным счета/заказы, показывает их в форме документа и выводит в печатную форму акта.

2 стартмани

12.05.2017    48191    5    denmax    7    

6

Распознавание и загрузка документов в 1С Промо

Универсальная программа-обработка для распознавания любых сканов или фото первичных документов в 1С (счета-фактуры, УПД, ТТН, акты и тд). Точность распознания до 98%.

от 11 рублей

Редактор движений документа. Сохранение в XML, обмен между базами, замена регистратора.

Обработка документов Универсальные обработки Файловый обмен (TXT, XML, DBF), FTP Платформа 1С v8.3 Абонемент ($m)

Редактор набора записей движений документа. Позволяет сохранить набор записей в XML, в настройки пользователя, прочитать сохраненный XML в другой идентичной базе, заменить регистратор. Можно изменять порядок записей, менять активность, как массово, так и по одной и др. Тонкий клиент, управляемые формы.

1 стартмани

07.09.2016    60966    181    Aphanas    5    

31

Легкий интернет-магазин из УТ 11.2

WEB-интеграция СRM Оптовая торговля Розничная торговля Платформа 1С v8.3 1С:Управление торговлей 10 Управленческий учет Абонемент ($m)

Обработка создания интернет-магазина из УТ 11. Создается единственный файл html, который содержит все выгруженные товары. Клиент составляет и отправляет заказ вам на e-mail прямо из браузера, не прибегая к использованию стороннего ПО.

11.08.2016    44506    0    hlopik    38    

71

Подсистема обмена данными с порталом ИМНС по электронным счетам-фактурам (автоматический обмен)

Регламентированный учет и отчетность WEB-интеграция Платформа 1С v8.3 Конфигурации 1cv8 Беларусь Бухгалтерский учет НДС Абонемент ($m)

Подсистема включает документы и обработки для автоматического обмена данными с порталом ИМНС через web-сервис. Присутствует возможность заполнения данными типовых операций за период, учёта входящих документов, учёта произвольных исходящих документов. Приложены обработки для запуска задания планировщика на автоматический обмен данными.

1 стартмани

28.07.2016    43767    21    emakei    3    

9

Загрузка Счета покупателя из PDF

Обработка документов Файловый обмен (TXT, XML, DBF), FTP Оптовая торговля Платформа 1С v8.3 Бухгалтерский учет 1С:Бухгалтерия 3.0 Абонемент ($m)

Обработка позволяет загрузить счет покупателя из pdf-файла в документ Счет на оплату покупателю (Бухгалтерия 3.0)

2 стартмани

23.05.2016    36277    41    John_d    6    

13