Новая функция самой большой генеративной AI-модели для русского языка получила название JARVIS. Сейчас сервис способен работать с языками программирования Java, Python и JavaScript.
Задачи проекта
Над созданием проекта работали команды SberDevices и SberWorks. Название JARVIS расшифровывается как «Just another really valuable intellectual system» («Еще одна очень ценная интеллектуальная система»). Сервис стал доступен для предварительного тестирования 15 ноября на платформе «Сбера» SmartMarket.
Функция JARVIS создана для того, чтобы искусственный интеллект получил возможность дополнять уже написанный разработчиками код. Это поможет находить уязвимые места в исходниках, получать подсказки во время работы, использовать режим автозавершения, переводить код с одного языка на другой. Авторы проекта надеются, что в перспективе смогут создать алгоритм, который будет генерировать программный код из обычного текстового описания задачи на русском языке.
JARVIS уже сейчас поддерживает плагины для интегрированных сред разработки IDEA, PyCharm, WebStorm и способен работать с языками Java, Python и JavaScript, однако пока эти инструменты могут использовать только внутренние разработчики системы. Расширения для IDE будут предложены сторонним программистам в начале следующего года.
Особенности разработки
По заверениям авторов JARVIS, новая функция при генерации подходящего кода способна анализировать структуру проекта и синтаксис используемого языка. Также сервис учитывает уже написанные комментарии на естественном языке и способен переводить неформальные описания функций в программный код. В ближайших планах «Сбера» – расширить список поддерживаемых языков программирования.
JARVIS основан на базе русскоязычной модели глубокой генеративной нейросети ruGPT-3, которая разработана специалистами «Сбера» и способна создавать тексты на русском языке. Для обучения ИИ написанию кода в качестве набора данных были использованы исходники приложений «Сбера», а также различные open-source библиотеки, находящиеся в публичном доступе.
Аналог уже есть
Ранее аналогичный проект представил Microsoft. Совместно с GitHub компания представила нейросетевого помощника для программистов Copilot, который обучен на датасете из терабайтов общедоступного кода. Сервис работает на основе решения OpenAI Codex, который, в свою очередь, базируется на модели GPT-3.
По словам разработчиков, которые уже опробовали функцию, главный недостаток проекта Microsoft – генерация большого массива кода с комментариями вместо ожидаемых нескольких строк. Будет ли решена эта проблема в JARVIS от «Сбера», пока неизвестно.