Open AI GPT OSS 120b на 3090 + TESLA V100

15.01.2026 09:09:05   Илья Низамов (IlyaNizamov)    46

В этом видео мы скачаем llm модель open ai gpt oss 120b с huggingface и запустим ее через инференс llama cpp на двух видео картах,
rtx 3090 и tesla v100.

В моей сборке такая конфигурация выдает 34ток/сек, но если бы были 2х3090, то скорость была бы значительно выше, так как удалось бы распределить больше слоев oss 120b в VRAM.

Категории:
 Программирование

Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
Для отправки сообщения требуется регистрация/авторизация
Айдар Сафин. RUNDECK – «швейцарский нож» для DEVOPS и GITOPS в экосистеме 1С
Александр Насонкин. Получение полноразмерных копий с базы 5 ТБ за 1.6 секунд
Денис Сытый. Перевод конфигурации на интерфейс 8.5 на примере CRM-системы для работы с ВУЗами
Александр Волков. 1С: Элемент. Доступные библиотеки, их возможности, подходы к разработке
Айдар Сафин. R&D в 1С: как исследования создают инновации
Виталий Подымников. Краткий обзор методики дымового тестирования из Vanessa ADD
Матвей Серегин. Решение на базе 1С:Предприятие.Элемент в информационном ландшафте предприятия
Валерий Бобров. От ChatGPT до GigaChat: как объективно оценить и выбрать LLM для разработки на 1С
Екатерина Холодова. ИИ для проведения код-ревью – опыт Magnit Tech
Роман Савинов. Как сделать первый, но уверенный шаг в тестировании