Языковая модель DeepMind превосходит аналоги по качеству работы

ИИ-лаборатория DeepMind представила исследования возможностей больших языковых моделей. В компании пришли к выводу, что необходимо дальнейшее масштабирование таких систем.

Улучшенные возможности

DeepMind разработала языковую модель Gopher, в которую вошли 280 млрд параметров. Эта система больше, чем аналогичный проект GPT-3 от OpenAI, который включает в себя 175 млрд параметров, однако уступает по размеру экспериментальной разработке Megatron от Microsoft и Nvidia (530 млрд параметров).

Проведенные исследования Gopher подтвердили: укрупнение языковой модели обеспечивает более частое получение релевантного результата, особенно в тестах на анализ настроений и обобщение. Однако только лишь увеличение параметров не решает другие проблемы ИИ и требует проведение дополнительных процедур обучения, основанных на отзывах пользователей-людей.

По результатам исследования DeepMind предложили доработки в трансформер – архитектуру для глубоких нейросетей. Разработчики добавили в нее улучшенный поиск (RETRO). ИИ обучен при помощи поиска информации в Интернете, благодаря чему система получила возможность запрашивать отрывки текста из сети и улучшать за этот счет итоги генерации текста.

Модель Gopher исследовали посредством прямого взаимодействия. Один из ключевых выводов ученых – выявление способности нейросети побуждать собеседника к диалогу. ИИ способен обсуждать клеточную биологию и давать правильные цитаты по теме, при том что для беседы не были предварительно заданы особые настройки. Ключевые проблемы модели, приводящие к отказам: повторение информации, отражение стереотипных предубеждений, распространение дезинформации.

Gopher общается на тему биологии

Во время изучения Gopher исследователи оценивали и другие модели с разным числом параметров на 152 языковых задачах и тестах. Ученые выяснили, что система DeepMind предлагает лучшие решения примерно в 80% случаев.

Изучение рисков

В другом исследовании DeepMind изучала опасности, которые связаны с развертыванием и использованием языковых моделей. К таким явлениям ученые относят факты генерации токсичных текстов и реплик, распространение ложной информации, спама или пропаганды, а также потенциал применения сгенерированного контента в злонамеренных целях.

Исследователи пришли к выводу, что связанные с нейросетями опасности будут только увеличиваться по мере того, как возрастет широкое распространение языковых моделей, например, при разработке чат-ботов или систем продаж. В отчете представлен 21 случай риска, для снижения которых необходима дальнейшая работа. Прежде всего, стоит расширить применяемые методы оценки рисков, потому что существующего сравнительного анализа недостаточно для этих целей.

Если вам удобнее смотреть новости в телеграме, то вот наша группа – ИНФОСТАРТ.

Автор:

Александр Вашкевич

Аналитик

Хакатон «Лидеры цифровой трансформации»: открыт прием заявок

+3 –

Новость ИТ и 1С Бизнес-аналитик Программист

До 18 сентября подавайте заявку на цифровое событие года – хакатон «Лидеры цифровой трансформации». Участников ждут 20 задач от крупных компаний, 40 млн рублей призового фонда, 14 дней онлайн-кодинга и финальный фестиваль в Москве.

16.09.2025 2015 AnastasiaKl 0

Slack ушел – 1С-Коннект и другие российские мессенджеры занимают его место

+3 –

Новость Импортозамещение ИТ и 1С

После ухода Slack из России в 2024 году бизнес стал переходить на отечественные корпоративные мессенджеры. Один из самых универсальных — 1С-Коннект. Расскажем подробнее о нём и других решениях российских разработчиков.

24.04.2025 3791 AnastasiaKl 5

Российские решения готовы занять место зарубежных в трех классах ИТ-средств

+3 –3

Новость ИТ-компания ИТ и 1С

С января по март 2025 года Ассоциация КП ПОО провела исследование отечественных систем виртуализации, коммуникации и контейнеризации по 266 показателям. Результаты показали, что медианная технологическая зрелость у этих ИТ-решений превышает 75%.

04.04.2025 3422 orenk0t 1

Минцифры планирует создать платформу для подтверждения навыков ИТ-специалистов

+2 –

Новость ИТ и 1С

Минцифры подготовило проект постановления по запуску платформы, на которой ИТ-специалисты могут пройти добровольное тестирование и подтвердить свою квалификацию.

11.12.2024 3654 user1915669 3

ФНС открыла бесплатный сервис для формирования машиночитаемых документов

+2 –

Новость ИТ и 1С ФНС ЭДО

Федеральная налоговая служба запустила интерактивный сервис, позволяющий формировать в машиночитаемом виде договоры, контракты, соглашения и спецификации. Чтобы создать документ и скачать получившийся файл, регистрация не требуется.

03.12.2024 3165 user2114475 0

Альянс по ИИ опубликовал новую модель с профессиями и компетенциями

+3 –

Новость ИТ и 1С

Российский Альянс по искусственному интеллекту обновил требования к специалистам по ИИ: вышла новая модель с основными профессиями и навыками. Теперь базовых профессий в сфере ИИ осталось только четыре.

01.11.2024 3589 user1915669 0

В России планируют внедрять новые системы безналичных расчетов: «Волна» и BRICS Pay

+4 –

Новость ИТ и 1С

Система платежей «Волна» по планам сделает возможной бесконтактную оплату для владельцев iPhone в России, а BRICS Pay позволит совершать безналичные расчеты иностранцам по картам Visa и Mastercard.

23.10.2024 4051 AnastasiaKl 0

Конструктор сайтов Wix уходит из России с 12 сентября

+2 –

Новость ИТ-компания ИТ и 1С

Конструктор сайтов Wix уходит из России с 12 сентября 2024 года – перестанут работать все российский аккаунты. Сайты, привязанные к аккаунтам, также перестанут работать.

11.09.2024 3791 user1915669 2

Для отправки сообщения требуется регистрация/авторизация

Языковая модель DeepMind превосходит аналоги по качеству работы

Улучшенные возможности

Изучение рисков

См. также

Журнал

База знаний

Лаборатория

Анализ & Управление

Сопровождение 1С

Корпоративные решения

Обучение

Маркетплейс

Проектный офис