Распознавание текста с помощью нейросетей Google Cloud Vision и 1С

09.08.22

Интеграция - WEB-интеграция

+146 –

Возможности Google Cloud Vision в распознавании текста.

Файлы

ВНИМАНИЕ: Файлы из Базы знаний - это исходный код разработки. Это примеры решения задач, шаблоны, заготовки, "строительные материалы" для учетной системы. Файлы ориентированы на специалистов 1С, которые могут разобраться в коде и оптимизировать программу для запуска в базе данных. Гарантии работоспособности нет. Возврата нет. Технической поддержки нет.

Наименование	Скачано	Купить файл	По подписке PRO
Обработка GoogleCloudVision .epf 7,61Kb 35	35	4 200 руб. Купить	5 SM Скачать
Обработка GoogleCloudVision для русского языка .epf 7,69Kb 140	140	4 200 руб. Купить	5 SM Скачать

Вы можете заказать платную доработку или адаптацию этой разработки под вашу конфигурацию на «Бирже заказов».

0% комиссии — оплата напрямую исполнителю;
Исполнители любого масштаба — от отдельных специалистов до команд под проект;
Прямой обмен контактами между заказчиком и исполнителем;
Безопасная сделка — при необходимости;
Рейтинги, кейсы и прозрачная система откликов.

ВНИМАНИЕ! Есть новая статья как сделать такую задачу на Яндекс Облаке.
Распознавание текста из изображений и PDF с помощью нейросетей Yandex Vision и 1С

Здравствуйте!

В этой статье я рассмотрю возможности распознавания текста (OCR) на чистом 1С с помощью нейросетей сервиса Google Cloud Vision.

Всё началось с того, что мне попалась на глаза статья на хабре о том, что можно очень легко использовать нейросети как сервис. Не нужно писать свою сеть и обучать ее, можно воспользоваться уже готовыми API. Принцип работы очень простой: нужно сделать POST запрос с картинкой, закодированной в base64, и получить json-ответ. И, разобрав его, программа может понять что изображено на картинке (Label detection) или же получить распознанный текст (OCR). Детальное описание возможностей Cloud Vision API можно посмотреть по ссылке. Работу с этим сервисом можно легко реализовать на чистом 1С, что я и сделал.

Регистрация в консоли разработчика и получение ключа.

Для начала нужно зарегистрироваться в консоли разработчика по ссылке console.cloud.google.com. Нужно создать проект, включить для него Google Cloud Vision API. Далее в меню консоли необходимо перейти в Диспетчер API-учетные данные и создать ключ API, который будет использоваться для тестирования. В документации есть хорошая инструкция на английском. Если все было сделано верно, то ваша консоль должна выглядеть как на картинке ниже:

Формат json-запроса

Согласно инструкции сервису нужно прислать json с полями requests (массив) image (объект с полем content где содержится base64-закодированное изображение) и features (массив с указанием нужного типа распознавания type, в данном случае TEXT_DETECTION). Код, который это делает, можно посмотреть в приложенной внешней обработке. В итоге получается вот такой файл JSON:

{
"requests": [
{
"image": {
"content": "base64 image content"
},
"features": [
{
"type": "TEXT_DETECTION"
}
]
}
]
}

Получение ответа Google

Отправка данных осуществляется с помощью объекта HTTPСоединение по протоколу HTTPS (с установкой ЗащищенноеСоединениеOpenSSL) и метода ОтправитьДляОбработки. В него передается HTTPЗапрос с сформриованным json файлом для отправки, заданным через метод УстановитьТелоИзДвоичныхДанных. В json-ответе Google нас интересует первый элемент с именем свойства description и его значение, в котором будет содержаться распознанный текст.

Попробуем отправить на распознавание картинку с английским текстом:

И вот что приходит в ответ, приведу фрагмент текста:

CEN Perform a wireless installation (wireless models only)
Before starting the installation, verify that the wireless access
point is working correctly, the computer is connected to the
network, and the product is turned on.
product, go
If there is not a solid blue light on the top of the to process A.
to
If there is a solid blue light on the top of the product, go process B.
1. Connect the USB cable between the computer and
the product. The HP Smart Install program (see picture

Как видно, получается очень хорошее качество распознавания.

А теперь попробуем русский текст:

И вот что получается в ответе от Google:

A
KBMTaHUIA nepeBopa C KapTbl Ha KapTy
KOA aBTOpH3aUnn
npH BO3HMKHOBeHun np06neM, cooounTe HOMep KBHTaHurn onepaTopy
Konn-ueHTpa unu coTpYAHMKV OTAeneHMA
+7 495 78-888-78-ANA MOCKBbIM MOC KOBCKoi o6naCTIA
8 800 2000-000 -Ana pernOHOB P]4;
CyMMa nepeBoga:
1 285P

Да, печальный итог. Но, как подсказали в комментариях, оказывается нужно в запросе у свойства imageContext поставить languageHints в ru.

Работа с русским языком

Как мне верно подсказали в комментариях, есть возможность указать язык для распознавания. Получается вот такой json-запрос:

{
"requests": 
[
	{
		"image": {
		"content": "base 64 image content"
		},
		"features": [
		{
		"type": "TEXT_DETECTION"
		}
		],
		"imageContext": {
		"languageHints": "ru"
		}
	}
]
}

Отправим для распознавания ту же самую квитанцию и получается очень хороший результат:

Выводы

Сама по себе возможность использовать мощнейшие нейросети Google с помощью несложных запросов впечатляет.

Распознавание русского языка тоже работает весьма хорошо, таким образом может вполне составить конкуренцию ABBYY. И цены на распознавание у Google Cloud гораздо более низкие.

В приложенной к статье внешней обработке можно посмотреть код конструирования JSON запроса, отправки его через HTTPСоединение и получения ответа.

PS Во вложении я добавил и новую версию обработки, которая формирует json запрос для распознавания русского языка.

Вступайте в нашу телеграмм-группу Инфостарт

OCR Google Cloud Распознавание текста

+146 –

См. также

Интеграция 1С с API Boxberry, СДЭК, Энергия, Почта России, DPD, ПЭК, Grastin, Деловые Линии, КСЕ, Dalli, ЯндексДоставка

WEB-интеграция Рабочее место Оптовая торговля Розничная торговля Логистика, склад и ТМЦ Пользователь 1С:Предприятие 8 1С:Бухгалтерия 2.0 1С:Бухгалтерия 3.0 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 1.6 1С:Управление нашей фирмой 3.0 1С:Управление торговлей 10 1С:Управление торговлей 11 1С:Розница 2 1С:Розница 3.0 Оптовая торговля, дистрибуция, логистика Россия Управленческий учет Платные (руб)

Программный продукт "Управление доставками в 1С" позволяет обмениваться с личным кабинетом Boxberry, СДЭК, Энергия, Почта России, DPD, ПЭК, Grastin, Деловые Линии, КСЕ, Dalli, ЯндексДоставка. Упрощает создание заявок и резервирование заказов прямо в интерфейсе 1С

24400 руб.

10.03.2016 73513 316 100

Интеграция Альфа Авто 5 и 6 и AUTOCRM + LOGICSTARS

Сайты и интернет-магазины WEB-интеграция Системный администратор Программист Пользователь 1С:Предприятие 8 1C:Бухгалтерия 1С:Управление торговлей 11 Автомобили, автосервисы Россия Управленческий учет Платные (руб)

Интеграционный модуль обмена между конфигурацией Альфа Авто 5 и Альфа Авто 6 и порталом AUTOCRM / LOGICSTARS. Данный модуль универсален. Позволяет работать с несколькими обменами AUTOCRM / LOGICSTAR разных брендов в одной информационной базе в ручном и автоматическом режиме.

42700 руб.

03.08.2020 24746 38 26

Интеграция Vetmanager с 1С: автоматизация учета для ветеринарных клиник. Синхронизация документов, справочников и оплат через API

WEB-интеграция Программист 1С:Предприятие 8 1С:Бухгалтерия 3.0 Бытовые услуги, сервис Платные (руб)

Расширение для автоматизации передачи данных между сервисом Vetmanager с 1С: Бухгалтерия 3.0. Решение позволяет загружать документы и справочники из Ветменеджер в 1С:Бухгалтерию, сокращая время на ручной ввод данных и минимизируя ошибки.

24000 руб.

02.02.2021 23463 73 52

Экспортер — автоматизация выгрузки данных из 1С в Spot2D

WEB-интеграция Программист Бизнес-аналитик 1С:Предприятие 8 1С:ERP Управление предприятием 2 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х 1С:Управление нашей фирмой 3.0 1С:Розница 3.0 Оптовая торговля, дистрибуция, логистика ИТ-компания Платные (руб)

Модуль "Экспортер" — это расширение для 1С, предназначенное для автоматизации процессов выгрузки данных. Оно позволяет эффективно извлекать, преобразовывать и передавать данные из систем 1С в интеграционную платформу Spot2D. Подсистема упрощает настройку, снижает количество ручных операций и обеспечивает удобный контроль данных.

17568 руб.

20.12.2024 6728 28 4

Интеграция 1С с OpenCart 2.x, 3x модуль обмена данными

WEB-интеграция Оптовая торговля Розничная торговля Программист 1С:Предприятие 8 1С:Розница 2 1С:Управление нашей фирмой 1.6 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 Розничная и сетевая торговля (FMCG) Оптовая торговля, дистрибуция, логистика Управленческий учет Платные (руб)

Модуль интеграции 1С с OpenCart 2.x, 3x позволяет обмениваться данными между OpenCart (самая популярная бесплатная cms для интернет-магазинов) и 1С:Предприятие 8.

6914 руб.

17.11.2015 133282 473 143

255

Обмен данными с Порталом поставщиков Москвы и МО через 1С

Оптовая торговля WEB-интеграция Бюджетный учет Обмен с ГосИС Бухгалтер Пользователь 1С:Предприятие 8 1С:Комплексная автоматизация 1.х 1С:Бухгалтерия 2.0 1С:Управление торговлей 10 1С:Управление производственным предприятием 1С:Управление нашей фирмой 1.6 1С:Бухгалтерия 3.0 1С:Управление торговлей 11 1С:Комплексная автоматизация 2.х Государственные, бюджетные структуры Россия Бухгалтерский учет Управленческий учет Платные (руб)

Обмен данными с "Порталом поставщиков" zakupki.mos.ru Москвы и Московской области с целью создания оферт для закупок государственными учреждениями. Модуль устраняет рутину, минимизирует ошибки и помогает выигрывать больше закупок. Работает строго по требованиям 44-ФЗ.

14640 руб.

13.12.2016 43802 57 39

Сервисы 1СПАРК Риски и 1С:Контрагент для «старых» конфигураций

WEB-интеграция Бизнес-аналитик Бухгалтер Пользователь 1С:Предприятие 8 1С:Комплексная автоматизация 1.х 1С:Бухгалтерия 2.0 1С:Управление торговлей 10 1С:Управление производственным предприятием 1С:Бухгалтерия государственного учреждения Россия Платные (руб)

Доступ в виде подписки к сервисам 1СПАРК Риски и 1С:Контрагент в «старых», но широко используемых конфигурациях.

6100 руб.

30.01.2019 28186 101 6

FortMonitor + 1С:УАТ ПРОФ: автоматизация мониторинга транспорта через ГЛОНАСС/GPS, учет ГСМ, формирование путевых листов. Снижение ручного ввода, фоновая синхронизация, демо-версия.

WEB-интеграция 1С 8.3 1C:Бухгалтерия Автомобили, автосервисы Беларусь Украина Россия Казахстан Управленческий учет Платные (руб)

Расширение для 1С:Управление Автотранспортом (ПРОФ) автоматизирует мониторинг транспорта (пробег, расход, координаты, стоянки) и формирование путевых листов. Включает отчеты, фоновую загрузку данных, работает без активации константы мониторинга. Формы — с открытым кодом, общие модули защищены. Доступна демо-версия. Снижает ручной ввод и повышает точность учета.

23034 руб.

25.05.2021 16199 44 8

Комментарии

Подписаться на ответы Инфостарт бот

Свернуть все

1. sashapere 160 08.02.17 21:08 Сейчас в теме

Круто!

2. TODD22 20 09.02.17 05:16 Сейчас в теме

распознавания текста (OCR) на чистом 1С с помощью нейросетей сервиса Google Cloud Vision

Так "на чистом 1С" или всё же "с помощью нейросети сервиса Google"? :)

Ответить

5. kiv1c 818 09.02.17 10:29 Сейчас в теме

(2) ну я имел ввиду что для подключения к API не нужны внешние объекты, только встроенные в 1С HTTPЗапрос и HTTPСоединение

3. l1ike 09.02.17 07:42 Сейчас в теме

Для русского языка попробуйте явно указать languageHints

6. shakmaev 348 09.02.17 11:43 Сейчас в теме

(3)Поддерживаю.
Ссылка на документ https://cloud.google.com/vision/docs/languages

7. kiv1c 818 09.02.17 13:41 Сейчас в теме

(6)
(3)
да, вы правы, указал languageHints и стало лучше. статью дополнил.

4. CSiER 36 09.02.17 09:57 Сейчас в теме

Лучше ocr от Adobe пока не встречал. Сервис от MS тоже не порадовал (там несколько api - пишу в контексте ocr).

8. zhuravlev_as 630 15.02.17 15:29 Сейчас в теме

Прикольно, а подобное же, но чтобы голос распознавал, возможно в 1С сделать?

9. kiv1c 818 15.02.17 16:51 Сейчас в теме

(8) думаю да, есть аж два варианта:
Google Cloud Speeсh API
и бесплатный и хороший Wit.Ai который используется например в Voicy bot в Телеграме

10. amoarok 140 27.03.17 12:45 Сейчас в теме

Веб-сервисы в облаках это конечно стильно, модно, молодёжно, но для таких красивых картинок хватит даже tesseract-ocr. Вот результат распознавания:
1>

Квитанция перевода с карты на карту

код авторизации

При возникновении проблем, сообщите номер квитанции оператору
колл-центра или сотруднику отделения

+7 495 78-888-78 - для Москвы и Московской области

8 800 2000-000 - для регионов РФ

Сумма перевода: 1 285 Р
Комиссия: 0 Р

Итого с комиссией: 1 285 Р

11. artik1994 27.03.17 13:29 Сейчас в теме

приходит ответ от сервера "Google developers console API activation"...
что это может быть?

12. tormozit 7379 02.04.17 00:50 Сейчас в теме

Распознавание текста на комбинированном языке (рус+англ) видел приличное только у ABBYY . Именно такое нужно в большинстве случаев при распознавании скриншотов. В частности ABBYY Screenshot reader отлично справляется с этой нелегкой задачей.

15. PLAstic 296 03.10.19 10:13 Сейчас в теме

(12)

ABBYY Screenshot reader

Я полазил по сайту и не нашёл, чтобы у данного продукта были методы API для распознавания файлов. Они есть?

16. tormozit 7379 03.10.19 10:56 Сейчас в теме

(15) бесплатных нет

17. PLAstic 296 04.10.19 11:00 Сейчас в теме

(16) Я не говорил про стоимость. Как раз боюсь выложить деньги за несуществующую функциональность.
У данного продукта есть возможность распознавания текста из файла-картинки?

13. silberRus 73 10.04.18 14:49 Сейчас в теме

В обработке ты забыл коммент убрать
ИмяВремФайла = "D:\test_reqest.json";// ПолучитьИмяВременногоФайла("json");
не у всех есть диск или права на D

14. silberRus 73 10.04.18 17:32 Сейчас в теме

Блин гугл требует денег или пробный период на год где он дает кредит 300$ (

18. CagoBHuK 32 29.11.19 10:33 Сейчас в теме

Присмотритесь к http://cgdev.ru/

19. unduty 14.10.21 16:36 Сейчас в теме

Приходит сообщение

Google developers console billing

Что делаю не так?

20. Anchoret 69 15.04.22 15:05 Сейчас в теме

(19) аналогично (:

21. kiv1c 818 16.04.22 13:43 Сейчас в теме

(20) видимо бесплатное использование этого сервиса кончилось

22. malinko.vasiliy 7 21.04.22 14:21 Сейчас в теме

(19) санкции. Нужно привязать валидную карту в кабинет разработчика

23. SkyD 25.07.22 09:29 Сейчас в теме

Скажите вы строите запрос к картинке на гугл диске или локальной?

24. SkyD 26.07.22 13:01 Сейчас в теме

Как решили вопрос с Google developers console billing?

Для отправки сообщения требуется регистрация/авторизация

Автор:

Иван Коротеев (kiv1c)

Рейтинг: 818

Вы можете заказать платную консультацию или разработку у автора. Будет создан приватный заказ на «Бирже заказов» для автора.

Публикация:

№ 586313

Создание 08.02.17 19:04

Обновление 09.08.22 17:04

Статистика:

Просмотры 55235

Загрузки 175

Рейтинг 146

Комментарии 24

Характеристики:

Код открыт Да

Рубрики WEB-интеграция

Кому Программист

Тип файла Внешняя обработка (ert,epf)

Платформа 1С:Предприятие 8

Конфигурация 1C:Бухгалтерия

Операционная система Не имеет значения

Страна Не имеет значения

Отрасль Не имеет значения

Налоги Не имеет значения

Вид учета Не имеет значения

Доступ к файлу Абонемент ($m)

Распознавание текста с помощью нейросетей Google Cloud Vision и 1С

Файлы

Регистрация в консоли разработчика и получение ключа.

Формат json-запроса

Получение ответа Google

Работа с русским языком

Выводы

См. также

Журнал

База знаний

Лаборатория

Анализ & Управление

Сопровождение 1С

Корпоративные решения

Обучение

Маркетплейс

Проектный офис

Мероприятия

Видеозаписи

Биржа заказов

Форум

Мерч

О компании