https://docvision.ru.tuna.am/ и бот в телеграм @DocumentsRecognitionBot
Что нам понадобится:
Про ОСень:
//infostart.ru/1c/articles/1980026/
Про Вино:
https://github.com/autumn-library/winow
Про коннектор:
https://github.com/vbondarevsky/1connector/tree/master
Про deepseek:
//infostart.ru/1c/tools/2366670/
На этих китах и держится весь этот сервис (пока что).
В планах мобилу Ленке из продуктового, с мобильным приложением и 1 кнопкой сфоткать накладную, после чего накладная уже в 1С :) )
Суть: мини сервер winow принимает картинку, распознает ее с помощью finereader, и полученный текст скармливает deepseek, который производит пост обработку и корректировку накладной, сглаживая ошибки и выдает ответ в виде json или html(можно deepseek сказать чтобы оформил как реальную накладную). Что с этим делать дальше?
Думаю вы разберетесь.
За основу я взял example из winow.
Вы не поверите(если не знакомы с ОСенью), но код основного модуля в итоге выглядит вот так:
Ну и собственно основная логика у меня уместилась в 2 эндпоинта:
&ТочкаМаршрута("start_processing")
Процедура НачатьОбработку(ДанныеФормы, ПараметрыЗапросаИменные, Ответ) Экспорт
// Генерация уникального ID задачи
УникальныйИД = Строка(Новый УникальныйИдентификатор());
ПутьКХранилищу = КаталогВременныхФайлов() + "tasks\";
СоздатьКаталог(ПутьКХранилищу);
// Сохранение исходного изображения
ИмяФайлаИзображения = ПутьКХранилищу + УникальныйИД + ".raw";
url = ПараметрыЗапросаИменные["url"];
Если ПустаяСтрока(url) Тогда
ДанныеФайла = ДанныеФормы.НайтиЗначениеПоМетаданным(Новый Структура("name", "file"));
ДанныеФайла.Записать(ИмяФайлаИзображения);
Иначе
urlclear = Сред(url, 9, СтрНайти(url, """,") - 9);
КоннекторHTTP.Get(urlclear).ДвоичныеДанные().Записать(ИмяФайлаИзображения);
КонецЕсли;
// Создание файла статуса
СтатусФайл = Новый ТекстовыйДокумент();
СтатусФайл.ДобавитьСтроку("processing");
СтатусФайл.Записать(ПутьКХранилищу + УникальныйИД + ".status");
//ЗапуститьОбработкуВФоне(УникальныйИД, ИмяФайлаИзображения);
// Запуск фоновой обработки
Сообщить(ИмяФайлаИзображения);
ПараметрыВыполнения = Новый Массив;
ПараметрыВыполнения.Добавить(УникальныйИД);
ПараметрыВыполнения.Добавить(ИмяФайлаИзображения);
Задание = ФоновыеЗадания.Выполнить(ЭтотОбъект, "ЗапуститьОбработкуВФоне", ПараметрыВыполнения);
//ЗапуститьФоновоеВыполнение("ЭтотОбъект.ЗапуститьОбработкуВФоне(Парметр1,Парметр2);",Новый Структура("Параметр1,Параметр2",УникальныйИД,ИмяФайлаИзображения));
Сообщить("Запущено фоновое");
// Возвращаем ID задачи клиенту
Ответ.УстановитьТипКонтента("json");
Ответ.ТелоТекст = "{""task_id"":""" + УникальныйИД + """}";
КонецПроцедуры
&ТочкаМаршрута("get_result")
Процедура ПолучитьРезультат(ПараметрыЗапросаИменные, Ответ) Экспорт
Идентификатор = ПараметрыЗапросаИменные["task_id"];
ПутьКХранилищу = КаталогВременныхФайлов() + "tasks\";
Ответ.УстановитьТипКонтента("json");
РезФайл = Новый ТекстовыйДокумент();
РезФайл.Прочитать(ПутьКХранилищу + Идентификатор + ".result");
Результат = РезФайл.ПолучитьТекст();
//Ответ.ТелоТекст = СтрШаблон("<!DOCTYPE html>%1", Результат);
Ответ.ТелоТекст = Результат;
// Очистка ресурсов
УдалитьФайлы(ПутьКХранилищу + Идентификатор + ".txt");
УдалитьФайлы(ПутьКХранилищу + Идентификатор + ".result");
УдалитьФайлы(ПутьКХранилищу + Идентификатор + ".raw");
КонецПроцедуры
Проверить у себя на практике, как все это работает, можно скачав архив с примером, в который достаточно вставить токен дипсик, выполнить oscript ocr.os и у вас на localhost:3333 свой сервис по распознаванию первички.
Разработка актуальна для логистических центров, и можно ее модифицировать под свои нужды.
Самое интересное, что это намного дешевле сервиса от вендора, в котором 3 руб./документ.
Здесь себестоимость запроса к обычной модели deepseek для 1 документа меньше 1 цента.
Спасибо за внимание!
Проверено на следующих конфигурациях и релизах:
- 1С:Библиотека стандартных подсистем, редакция 3.1, релизы 3.1.11.189
Вступайте в нашу телеграмм-группу Инфостарт