«Сбер» обучил нейросеть ruGPT-3 генерировать программный код

«Сбер» обучил нейросеть ruGPT-3 генерировать программный код
18.11.2021
22785

Новая функция самой большой генеративной AI-модели для русского языка получила название JARVIS. Сейчас сервис способен работать с языками программирования Java, Python и JavaScript.

Задачи проекта

Над созданием проекта работали команды SberDevices и SberWorks. Название JARVIS расшифровывается как «Just another really valuable intellectual system» («Еще одна очень ценная интеллектуальная система»). Сервис стал доступен для предварительного тестирования 15 ноября на платформе «Сбера» SmartMarket.

Функция JARVIS создана для того, чтобы искусственный интеллект получил возможность дополнять уже написанный разработчиками код. Это поможет находить уязвимые места в исходниках, получать подсказки во время работы, использовать режим автозавершения, переводить код с одного языка на другой. Авторы проекта надеются, что в перспективе смогут создать алгоритм, который будет генерировать программный код из обычного текстового описания задачи на русском языке.

JARVIS уже сейчас поддерживает плагины для интегрированных сред разработки IDEA, PyCharm, WebStorm и способен работать с языками Java, Python и JavaScript, однако пока эти инструменты могут использовать только внутренние разработчики системы. Расширения для IDE будут предложены сторонним программистам в начале следующего года.

Особенности разработки

По заверениям авторов JARVIS, новая функция при генерации подходящего кода способна анализировать структуру проекта и синтаксис используемого языка. Также сервис учитывает уже написанные комментарии на естественном языке и способен переводить неформальные описания функций в программный код. В ближайших планах «Сбера» – расширить список поддерживаемых языков программирования.

JARVIS основан на базе русскоязычной модели глубокой генеративной нейросети ruGPT-3, которая разработана специалистами «Сбера» и способна создавать тексты на русском языке. Для обучения ИИ написанию кода в качестве набора данных были использованы исходники приложений «Сбера», а также различные open-source библиотеки, находящиеся в публичном доступе.

Аналог уже есть

Ранее аналогичный проект представил Microsoft. Совместно с GitHub компания представила нейросетевого помощника для программистов Copilot, который обучен на датасете из терабайтов общедоступного кода. Сервис работает на основе решения OpenAI Codex, который, в свою очередь, базируется на модели GPT-3.

По словам разработчиков, которые уже опробовали функцию, главный недостаток проекта Microsoft – генерация большого массива кода с комментариями вместо ожидаемых нескольких строк. Будет ли решена эта проблема в JARVIS от «Сбера», пока неизвестно.

Автор:
Аналитик

См. также

Минцифры подготовило проект постановления по запуску платформы, на которой ИТ-специалисты могут пройти добровольное тестирование и подтвердить свою квалификацию.

11.12.2024    987    user1915669    3       

2

Федеральная налоговая служба запустила интерактивный сервис, позволяющий формировать в машиночитаемом виде договоры, контракты, соглашения и спецификации. Чтобы создать документ и скачать получившийся файл, регистрация не требуется.

03.12.2024    791    user2114475    0       

2

Российский Альянс по искусственному интеллекту обновил требования к специалистам по ИИ: вышла новая модель с основными профессиями и навыками. Теперь базовых профессий в сфере ИИ осталось только четыре.

01.11.2024    950    user1915669    0       

3

Система платежей «Волна» по планам сделает возможной бесконтактную оплату для владельцев IPhone в России, а BRICS Pay позволит совершать безналичные расчеты иностранцам по картам Visa и Mastercard.

23.10.2024    1257    AnastasiaKl    0       

4

Конструктор сайтов Wix уходит из России с 12 сентября 2024 года – перестанут работать все российский аккаунты. Сайты, привязанные к аккаунтам, также перестанут работать.

11.09.2024    1238    user1915669    2       

2

ИИ научат разработке цифровых интегральных микросхем – несколько российских научных институтов заявили об участии в проекте. Проект рассчитан на 3 года – с 2024 по 2026.

23.07.2024    872    user1915669    0       

2

Развитие искусственного интеллекта и цифровых сервисов в России стало причиной роста потребности в мощных центрах обработки данных. Эксперты прогнозируют, что дефицит ЦОД, который уже наблюдается сегодня, в ближайшие годы будет только усиливаться.

18.07.2024    987    AnastasiaKl    0       

1

В сентябре 2024 года видеоигры в России начнут маркировать – пока на добровольной основе. Геймерам будут сообщать о семи видах чувствительного (неприятного) контента в игре.

17.07.2024    1064    user1915669    0       

1

Комментарии

Инфостарт бот
1. ixijixi 18.11.21 16:50 Сейчас в теме
Налицо нарушение авторских прав, коим нас так любят попрекать деятели из того же Сбера
Прикрепленные файлы:
2. m_aster 18.11.21 22:10 Сейчас в теме
(1)Ну, у них "Просто довольно умная система", а у нас то ли дело: "..очень ценная интеллектуальная система".
А так, да, могли бы на русский манер назвать, используя что-то типа: СберЦИС(Ценная Интеллектуальная Система от Сбера) или СберВИС(Важная Интеллектуальная Система от Сбера) или СОВИС(Очень Важная Интеллектуальная Система от Сбера).
Или совсем кратко СИС(Интеллектуальная Система от Сбера). Или на английский манер SIS(используется такое где-то, нет?), Sber Intellectual System.
Тут и логотип можно придумать симпатишный. Чтобы уже была не просто еще одна ИС, а реально независимая высокоразвитая система с поддержкой не только англоязычных языков программирования, но и наших родных, 1С в частности.
Чтобы хоть и походить на американцев, но все же иметь что-то свое.
maksa2005; Obertone; +2 Ответить
3. пользователь 19.11.21 14:09
Сообщение было скрыто модератором.
...

Оставьте свое сообщение