ABBYY опубликовала исходный код своей библиотеки машинного обучения

ABBYY опубликовала исходный код своей библиотеки машинного обучения
23.06.2020
36333

Компания ABBYY выложила на GitHub исходники своей нейросети, используемой для распознания текста. Программный код открыт под свободной лицензией Apache 2.0.

Нейросеть для бизнеса

Библиотека машинного обучения NeoML выложена на GitHub для того, чтобы ускорить развитие облачных, десктопных и мобильных решений, применяющих нейросети. Она позволяет разработчикам дополнять свои приложения новыми возможностями. В ABBYY библиотека используется для продуктов, нуждающихся в компьютерном зрении, обработке естественных языков в структурированных и неструктурированных документах. 

NeoML поддерживает инструменты ONNX, благодаря чему может быть легко интегрирована в сторонние фреймворки. Стандарт поддерживается Microsoft, Facebook и другими компаниями и поэтому полностью совместим с другими решениями организаций. 

Константин Гольдштейн, ведущий эксперт по стратегическим технологиям Microsoft в России, отмечает, что NeoML позволяет программистам получить доступ к ряду возможностей, в которых нуждаются современные бизнес-приложения. Интеграция с ONNX открывает перспективы создания обширной экосистемы разработчиков вокруг проекта ABBYY.

Особенности библиотеки

NeoML поддерживает и классический метод машинного обучения, и глубокий. Библиотека может быть использована в облачной или мобильной средах. Ее нейросети применяют до 100 слоев, а для классического машинного обучения доступно более 20 алгоритмов.

Модели, создаваемые при помощи решения, пригодятся в задачах идентификации, классификации, семантической сегментации, прогнозирования. Например, банковские приложения на основе NeoML могут поддерживать функцию прогнозирования спроса на финансовые услуги. 

Еще одна отличительная черта библиотеки ABBYY – кроссплатформенность. NeoML совместима с устройствами на базе Windows, Linux, macOS, iOS и Android. Расчеты могут производиться и на центральных процессорах, и на графических. При работе с GPU в ОС от Microsoft необходима видеокарта, поддерживающая архитектуру параллельных вычислений CUDA версии 10.2. Для iOS нужен процессор модели A7 или старше. Android-устройства для применения NeoML нуждаются в поддержке API Vulkan 1.0. На macOS и Linux использовать GPU для машинного обучения пока что нельзя. 

Для работы с NeoML необходимо знание С++, Java, Objective C или Swift. Разработчики обещают в скором времени добавить поддержку Python. Внутренние тесты ABBYY продемонстрировали, что скорость библиотеки на задачах обработки изображений превышает аналоги на 15-20%.


Купить продукты ABBYY на Инфостарте

Если вам удобнее смотреть новости в телеграме, то вот наша группа – ИНФОСТАРТ.

Автор:
Аналитик

См. также

Samsung представила чип биометрической защиты, который может быть установлен в банковские карты. Разработка объединяет в себе различные элементы безопасности, ранее наносимые на саму карту.

28.01.2022    10642    VKuser24342747    0       

1

Apple в очередной раз перенесла сроки вступления в силу новых правил App Store. В них прописано новое требование для всех разработчиков: добавить в приложение возможность удалять аккаунт.

27.01.2022    18249    VKuser24342747    0       

1

Одна из самых мощных многоязычных моделей распознавания речи XLS-R теперь доступна всем разработчикам. Facebook опубликовала исходный код решения на GitHub и Hugging Face.

27.01.2022    12884    user1015646    0       

1

Китайский производитель смартфонов OPPO опубликовал доклад, в котором представил идею зарядки IoT-устройств от сигналов мобильных телефонов, Bluetooth и сетей Wi-Fi.

26.01.2022    8361    VKuser24342747    2       

1

Microsoft представила новый инструмент на базе искусственного интеллекта. BugLab использует технологии глубокого обучения, чтобы находить баги в коде и давать советы по их исправлению.

24.12.2021    19721    user1015646    0       

1

На выставке The Game Awards компания Google заявила, что Android-игры придут в Windows на десктопе уже в 2022 году.

20.12.2021    18258    user1015646    0       

1

Компания «Аквариус» представила устройство Aquarius CMP NS M11, которое полностью совместимо с Kaspersky OS. К концу года организация готова произвести 3 тыс. экземпляров телефона.

07.12.2021    23285    VKuser24342747    5       

1

Компания «Открытая мобильная платформа» выпустила мобильную операционную систему «Аврора» 4.0. Релиз включает более 300 улучшений, из них 40 – важные нововведения.

03.12.2021    25989    VKuser24342747    6       

3

Комментарии

Инфостарт бот
1. Darklight 29.06.20 14:06 Сейчас в теме
И можно это теперь как-то прикрутить к 1С? Да ещё и бесплатно?
rbdaurov; +1 Ответить
3. s22 07.07.20 19:22 Сейчас в теме
(1)
И можно это теперь как-то прикрутить к 1С? Да ещё и бесплатно?

Есть TENSORFLOW и отлаженее и есть стыковки со всем и библиотек куча.
Есть Torch по факту он стандарт.

Смысл в этой библиотеке?
4. Darklight 08.07.20 09:32 Сейчас в теме
(3)Возможно, я не совсем понял для чего применяется данная библиотека. Я себе сразу представил нейросети для распознавания текста :-(

Честно, когда-то давно, интересовался этой темой, на тот момент (около 7-10 лет назад) - отсканированный русский текст (в т.ч. в печатных документах) распознавал относительно сносно только aBBY - у них есть API для программного подключения (на том момент это было OLE-automation, и стоило баснословных денег - намного дороже любой пользовательской интерактивной лицензии), вот я и подумал, что теперь это можно было бы прикрутить к 1С бесплатно.... условно бесплатно - сразу понял, что тут сырой (в смысле RAW) алгоритм - и все рюшечки по его практическому применению для распознавания сложных документов придётся всё-равно прикручивать самостоятельно "сверху" - и это не так уж просто - что в очередной раз задумаешься о покупке готового бизнес-API.

С другой стороны - даже если это всего лишь абстрактное машинное обучение - это тоже хорошо - ибо "своё" "родное" "отечественное" мне вот больше греет душу... чем западное - главное, чтобы не государственное было.... так что будут ждать появления встроенной поддержке нейростетей и машинного обучения в возможно будущей платформе 1С Предприятие 9.5 - лет так через 50 :-] главное дожить и дождаться =/
5. s22 08.07.20 09:54 Сейчас в теме
(4)
С другой стороны - даже если это всего лишь абстрактное машинное обучение - это тоже хорошо - ибо "своё" "родное" "отечественное" мне вот больше греет душу... чем западное - главное, чтобы не государственное было.... так что будут ждать появления встроенной поддержке нейростетей и машинного обучения в возможно будущей платформе 1С Предприятие 9.5 - лет так через 50 :-] главное дожить и дождаться =/


Удивительно, но ядро библиотеки пишется за неделю и оно будет сравнимо по качеству с имеющимися.
Библиотеки распознавания дофига. Тот же Tesseract. Я использовал его для распознавания в 1с. Сейчас с нейросетями это не проблема.
2. frkbvfnjh 30.06.20 07:00 Сейчас в теме
Когда встроят в документооборот?

Оставьте свое сообщение