Open AI GPT OSS 120b на 3090 + TESLA V100

15.01.2026 09:09:05   Илья Низамов (IlyaNizamov)    445

В этом видео мы скачаем llm модель open ai gpt oss 120b с huggingface и запустим ее через инференс llama cpp на двух видео картах,
rtx 3090 и tesla v100.

В моей сборке такая конфигурация выдает 34ток/сек, но если бы были 2х3090, то скорость была бы значительно выше, так как удалось бы распределить больше слоев oss 120b в VRAM.

Категории:
 Программирование

Подписаться на ответы Инфостарт бот Сортировка: Древо развёрнутое
Свернуть все
Для отправки сообщения требуется регистрация/авторизация
Александр Пузаков. Математика в коде, или про чистоту функций
Владимир Бессонов. 1С без драмы: когда обновления работают сами
Иван Панов. Тестирование релизов – Путь самурая
Игорь Кайбанов. Снятся ли андроидам дедлайны? Искусственный интеллект в СЭД на старте перехода
(Не) Значительное Знач - Митап 1С от MagnitTech
Контантин Ожерельев. Почему ручной деплой до сих пор жив и сколько времени он реально занимает?
Михаил Куцаев. Автоматизация тестирования в условиях ограниченных ресурсов и многообразия систем
Иван Казеев. Практические кейсы использования Vanessa Automation
Никита Баушев. К вайб-кодингу через боль
Владимир Конырев. Как мы интегрировали GPT модели к сервису MAKER и что из этого вышло