«Сбер» открыл доступ к двум нейросетям для генерации текста

25.07.2023      1097

«Сбер» предоставил свободный доступ к языковой модели ruGPT-3.5, предназначенной для генерации текста на русском языке. Кроме того, стала доступна нейросеть mGPT, поддерживающая 61 язык, включая языки СНГ и малых народов России.

Модель для русского языка

Модель Russian Generative Pretrained Transformer версии 3.5 с 13 млрд параметров (ruGPT-3.5 13B) была разработана для использования в чат-боте «Сбера» GigaChat. Кроме нее, при разработке сервиса применялась NeONKA (NEural Omnimodal Network with Knowledge-Awareness).

Нейросеть ruGPT-3.5 13B представляет собой доработанную архитектуру GPT-3 от OpenAI, заточенную под генерацию текстов на русском языке. Кроме того, модель способна работать с английским языком и языками программирования. Длина ее контекста составляет 2048 токенов.

Для обучения применялся массив текстов весом более 1 ТБ. В него входили текстовые данные из открытых источников, часть открытого сета с кодом The Stack от коллаборации исследователей BigCode и корпусы новостных текстов. Тренировали нейросеть команды SberDevices и Sber AI при поддержке Института искусственного интеллекта AIRI.

Модель ruGPT-3.5 опубликована под лицензий MIT, что позволяет использовать ее всем разработчикам. Получить доступ к нейросети можно через сервис HuggingFace либо на российской платформе ML Space в хабе предобученных моделей и датасетов DataHub.

Мультиязычная модель

В открытом доступе стала доступна модель mGPT 13B. Она также содержит 13 млрд параметров. Нейросеть способна генерировать продолжение текста на 61 языке, среди которых представлены языки СНГ и малых народов России. Длина контекста модели – 512 токенов. Для обучения применялись 600 ГБ данных, собранных из открытых источников и очищенных и подготовленных датасетов на разных языках.  

Модель mGPT подойдет для генерации текста, решения различных задач в области обработки естественного языка. Нейросеть возможно дообучить или применять в составе нескольких моделей. 

Как и ruGPT-3.5, модель «Сбера» распространяется под лицензией MIT и доступна в HuggingFace и ML Space. 

Цель проектов

Андрей Белевцев, руководитель блока «Технологии» Сбербанка, рассказал, что технологическая компания выступает за открытость технологий и возможность обмениваться опытом с профессиональным сообществом. В замкнутой среде потенциал разработок снижается. 

В «Сбере» уверены, что свободный доступ к обученным моделям поможет российским исследователям и разработчикам в их работе, для которой нужны сверхмощные языковые нейросети. С их помощью специалисты смогут создавать собственные технологические продукты и решения.


 

Автор:
Аналитик


См. также

Новость Искусственный интеллект ИТ-Новость

ИИ научат разработке цифровых интегральных микросхем – несколько российских научных институтов заявили об участии в проекте. Проект рассчитан на 3 года – с 2024 по 2026.

23.07.2024    202    user1915669    0       

1

Новость Дата-центры Искусственный интеллект ИТ-Новость

Развитие искусственного интеллекта и цифровых сервисов в России стало причиной роста потребности в мощных центрах обработки данных. Эксперты прогнозируют, что дефицит ЦОД, который уже наблюдается сегодня, в ближайшие годы будет только усиливаться.

18.07.2024    360    AnastasiaKl    0       

1

Новость ИТ-Новость

В сентябре 2024 года видеоигры в России начнут маркировать – пока на добровольной основе. Геймерам будут сообщать о семи видах чувствительного (неприятного) контента в игре.

17.07.2024    413    user1915669    0       

1

Новость Законодательство ИТ-Новость

Депутаты Госдумы работают над законопроектом по ужесточению контроля за электросамокатами. Среди мер: обязательная регистрация СИМ (средств индивидуальной мобильности) и разработка системы отслеживания их перемещений.

10.07.2024    522    AnastasiaKl    2       

1

Новость Искусственный интеллект ИТ-Новость

В 2024 году «Сколково» выделит пилотным проектам в сфере искусственного интеллекта гранты на общую сумму 554 млн рублей. В результате отбора финансирование получат проекты с применением ИИ в областях производства, операционной деятельности и в работе предоставляемых сервисов.

12.04.2024    1058    AnastasiaKl    3       

3

Новость ИТ-Новость

Пятничное: в России вступил в силу стандарт подготовки по дисциплине «спортивное программирование». В стандарт вошли требования к физическим показателям спортсменов и скорости набора текста.

16.02.2024    860    VKuser24342747    2       

1

Новость ИТ-Новость

Федеральное агентство по техническому регулированию и метрологии (Росстандарт) утвердило национальный стандарт протокола LoRaWAN RU, таким образом он получил официальный статус. Технология используется для беспроводной передачи данных между устройствами интернета вещей.

19.01.2024    653    VKuser24342747    0       

2

Новость Законодательство ИТ-Новость

12 декабря вступил в силу Федеральный закон, меняющий срок, к которому все владельцы сайтов должны внести изменения в порядок авторизации пользователей на сайте. Закон вводит переходный период до 1 января 2025 года.

20.12.2023    796    VKuser24342747    2       

1
Комментарии
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
1. user2004916 23.10.23 11:38 Сейчас в теме
не актуально это ...
Оставьте свое сообщение