Языковая модель DeepMind превосходит аналоги по качеству работы

17.12.2021      28492

ИИ-лаборатория DeepMind представила исследования возможностей больших языковых моделей. В компании пришли к выводу, что необходимо дальнейшее масштабирование таких систем.

Улучшенные возможности

DeepMind разработала языковую модель Gopher, в которую вошли 280 млрд параметров. Эта система больше, чем аналогичный проект GPT-3 от OpenAI, который включает в себя 175 млрд параметров, однако уступает по размеру экспериментальной разработке Megatron от Microsoft и Nvidia (530 млрд параметров).

Проведенные исследования Gopher подтвердили: укрупнение языковой модели обеспечивает более частое получение релевантного результата, особенно в тестах на анализ настроений и обобщение. Однако только лишь увеличение параметров не решает другие проблемы ИИ и требует проведение дополнительных процедур обучения, основанных на отзывах пользователей-людей.

По результатам исследования DeepMind предложили доработки в трансформер – архитектуру для глубоких нейросетей. Разработчики добавили в нее улучшенный поиск (RETRO). ИИ обучен при помощи поиска информации в Интернете, благодаря чему система получила возможность запрашивать отрывки текста из сети и улучшать за этот счет итоги генерации текста.

Модель Gopher исследовали посредством прямого взаимодействия. Один из ключевых выводов ученых – выявление способности нейросети побуждать собеседника к диалогу. ИИ способен обсуждать клеточную биологию и давать правильные цитаты по теме, при том что для беседы не были предварительно заданы особые настройки. Ключевые проблемы модели, приводящие к отказам: повторение информации, отражение стереотипных предубеждений, распространение дезинформации.

 

Gopher общается на тему биологии

 

Во время изучения Gopher исследователи оценивали и другие модели с разным числом параметров на 152 языковых задачах и тестах. Ученые выяснили, что система DeepMind предлагает лучшие решения примерно в 80% случаев.

Изучение рисков

В другом исследовании DeepMind изучала опасности, которые связаны с развертыванием и использованием языковых моделей. К таким явлениям ученые относят факты генерации токсичных текстов и реплик, распространение ложной информации, спама или пропаганды, а также потенциал применения сгенерированного контента в злонамеренных целях.

Исследователи пришли к выводу, что связанные с нейросетями опасности будут только увеличиваться по мере того, как возрастет широкое распространение языковых моделей, например, при разработке чат-ботов или систем продаж. В отчете представлен 21 случай риска, для снижения которых необходима дальнейшая работа. Прежде всего, стоит расширить применяемые методы оценки рисков, потому что существующего сравнительного анализа недостаточно для этих целей.


Автор:
Аналитик


См. также

Новость Искусственный интеллект ИТ-Новость

ИИ научат разработке цифровых интегральных микросхем – несколько российских научных институтов заявили об участии в проекте. Проект рассчитан на 3 года – с 2024 по 2026.

23.07.2024    197    user1915669    0       

1

Новость Дата-центры Искусственный интеллект ИТ-Новость

Развитие искусственного интеллекта и цифровых сервисов в России стало причиной роста потребности в мощных центрах обработки данных. Эксперты прогнозируют, что дефицит ЦОД, который уже наблюдается сегодня, в ближайшие годы будет только усиливаться.

18.07.2024    356    AnastasiaKl    0       

1

Новость ИТ-Новость

В сентябре 2024 года видеоигры в России начнут маркировать – пока на добровольной основе. Геймерам будут сообщать о семи видах чувствительного (неприятного) контента в игре.

17.07.2024    409    user1915669    0       

1

Новость Законодательство ИТ-Новость

Депутаты Госдумы работают над законопроектом по ужесточению контроля за электросамокатами. Среди мер: обязательная регистрация СИМ (средств индивидуальной мобильности) и разработка системы отслеживания их перемещений.

10.07.2024    521    AnastasiaKl    2       

1

Новость Искусственный интеллект ИТ-Новость

В 2024 году «Сколково» выделит пилотным проектам в сфере искусственного интеллекта гранты на общую сумму 554 млн рублей. В результате отбора финансирование получат проекты с применением ИИ в областях производства, операционной деятельности и в работе предоставляемых сервисов.

12.04.2024    1057    AnastasiaKl    3       

3

Новость ИТ-Новость

Пятничное: в России вступил в силу стандарт подготовки по дисциплине «спортивное программирование». В стандарт вошли требования к физическим показателям спортсменов и скорости набора текста.

16.02.2024    858    VKuser24342747    2       

1

Новость ИТ-Новость

Федеральное агентство по техническому регулированию и метрологии (Росстандарт) утвердило национальный стандарт протокола LoRaWAN RU, таким образом он получил официальный статус. Технология используется для беспроводной передачи данных между устройствами интернета вещей.

19.01.2024    651    VKuser24342747    0       

2

Новость Законодательство ИТ-Новость

12 декабря вступил в силу Федеральный закон, меняющий срок, к которому все владельцы сайтов должны внести изменения в порядок авторизации пользователей на сайте. Закон вводит переходный период до 1 января 2025 года.

20.12.2023    795    VKuser24342747    2       

1
Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
Оставьте свое сообщение