«Сбер» анонсировал доступ к своей платформе для машинного обучения ML Space для сторонних разработчиков. Оплачивать можно будет только фактическое время работы вычислительной системы.
SberCloud, входящий в экосистему «Сбера», сделает облако ML Space открытым для программистов с 12 декабря. Благодаря сервису можно запускать процессы распределенного машинного обучения более чем на тысяче GPU. Разработчики при помощи облачной платформы смогут выполнять различные операции – от ввода данных до автоматического развертывания обученных моделей в SberCloud. ML Space позволяет проводить полный цикл разработки приложений на базе нейросетей.
Сколько стоит
Для оплаты возможностей облачного сервиса будет применена модель Pay-As-You-Go («Оплата по мере потребления»). Тариф за использование модулей ML Space для обучения и препроцессинга начинается от 3 рублей за одну GPU-минуту и от 0,12 рубля за одну CPU-минуту. Инференс будет стоить 0,054 копейки, деплой — от 0,05 рублей за GPU-секунду и от 0,12 рублей за СPU-минуту. Хранение данных на серверах обойдется разработчикам в 1,2 рубля.
Кроме того, ML Space запустит систему корпоративных грантов «ML Space для бизнеса». Благодаря программе российские компании смогут получить до 1 млн рублей на разработку технологий на базе машинного обучения и их внедрение в собственные ИИ-приложения.
Мощность и модули
Архитектура ML Space построена на базе суперкомпьютера «Кристофари», использующего вычислительные узлы Nvidia DGX-2. Каждый их них состоит из двух 24-ядерных процессоров Intel Xeon Platinum 8168 с тактовой частотой 2,7 ГГц и способен поддерживать до 16 графических ускорителей Nvidia Tesla V100 с 32 ГБ памяти HBM2. Суперкомпьютер занимает 36 строчку рейтинга самых производительных систем в мире, имея вычислительную мощность в 6,7 петафлопс.
ML Space позволяет создавать модели машинного обучения в автоматическом режиме при помощи технологии LAMA со специальным модулем AutoML. Запуск процесса тренировки нейросетей и доступ к мониторингу расхода вычислительных ресурсов отслеживанием загрузки системы по разрезам CPU, GPU, RAM доступен благодаря модулю Environments. Чтобы развернуть готовую модель машинного обучения в облаке SberCloud, можно воспользоваться модулем AutoDeploy. Для разметки данных доступен модуль TagMe.
В ML Space сразу же доступны и настроены популярные фреймворки и библиотеки для разработки нейросетей.В качестве среды обучения можно использовать любой Docker-образ.
Тренд последних лет
Крупный бизнес, связанный с информационными технологиями, регулярно выпускает на рынок новые платформы для упрощения машинного обучения. К примеру, Google поддерживает сервис Colab, который также позволяет разрабатывать ML-модели и бесплатно тренировать их на мощных GPU и TPU. Существуют и другие аналоги нового продукта «Сбера»: Jupyter Notebook, Azure Notebooks, Amazon Sagemaker.