У меня возникла идея проверить насколько различается скорость инференса LLM моделей не только в сравнении CPU и GPU, но и между младшими моделями со старшими прУ меня возникла идея проверить насколько различается скорость инференса LLM моделей не только в сравнении CPU и GPU, но и между младшими моделями со старшими пр

Запуск модели gpt-oss на 20 и 120 миллиардов параметров, на процессоре Core I9 для решения непростой задачи без GPU

2026/02/19 23:36
3м. чтение
Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу crypto.news@mexc.com

У меня возникла идея проверить насколько различается скорость инференса LLM моделей не только в сравнении CPU и GPU, но и между младшими моделями со старшими при обработке без использования GPU.
Для сравнения я выбрал модель gpt-oss:20b (размер модели 14Гб) и gpt-oss:120b (размер модели 65Гб). Запустил тест моделей я на компьютере с процессором Intel Core I9 14900K и 192Гб оперативной памяти.

Для теста я задал каверзную задачку:

И пациентом стала модель gpt-oss:20b (может быть запущена на ПК с 32Гб оперативки). В результате мне пришлось ждать почти 35 минут, я даже в магазин успел съездить. Но спустя эти 35 минут я получил неверный ответ, скрины ниже.

3d1977625d9297f5809f43714406631b.png0a8ace9e3a5028646e5347ab833998f8.png

Далее я сказал что результат не верен, следующий ответ она думала 23 минуты, но увы, так же неправильно.

2d55008afae7aed11d286af2f1fec0ab.png

но уже даже составила таблицу.

7e93b38033c00eb883065d7f3d77449d.png

В итоге потратив час на модель gpt-oss:20b и не добившись правильного ответа со второй попытки, я приступил к тесту gpt-oss:120b чисто на CPU, памяти для запуска потребовалось 65Гб, немало и простой ПК даже с 64Гб не сможет запустить эту модель к сожалению. И я приготовился ждать долго. Однако мой шаблон был сломан, спустя всего 17 минут, gpt-oss:120b выдала верный результат.

74d93711630a8ed1d95dd95d1e7c020f.pngc7691c06a6c81320b8ef045fe0393e0d.png

Таким образом получилось что модель объемом 65 гигабайт, решила задачу правильно в 2 раза быстрей чем ее младшая модель.

Но результат был еще интересней когда я запустил эту же задачу но уже используя GPU RTX4090 48Gb, в моей системе их 2 штуки с общим объемом VRAM 96Гб.
Так вот gpt-oss:20b решила эту проблему примерно за 3 минуты, но самое главное правильно используя только одну видеокарту.
Далее я запустил тест модели gpt-oss:120b на GPU, правильное решение заняло всего полторы минуты.

Что мы получили в итоге:

модели с малым числом параметров обучения занимают немного места в памяти и могут запускаться даже на условно простых ПК только на CPU, но, они при этом выдают неправильные результаты и требуют очень много времени (более 30 минут на первый запрос). Модели с большим числом параметров обучения (gpt-oss:120b) выдают верный результат всего за 17 минут та подобной задаче.


А вот при запуске моделей на GPU, gpt-oss:20b выдала правильный ответ за 3 минуты используя только один ускоритель, а модель gpt-oss:120b выдала верный результат за полторы минуты, но уже используя 2 GPU.

Но при использовании GPU в моем тесте младшая модель решила задачу правильно с первого раза за 3 минуты. Но старшая модель, объемом более чем 4 раза, решила задачу всего за полторы минуты.

PS. Получается что работа LLM зависит как от объема, так и источника обработки. И CPU инференс LLM сильно проигрыват.

Возможно более простые задачи небольшие LLM решают с хорошей точностью даже на обычных ноутбуках с достаточным объемом памяти. Но вот чуть более сложные задачи я думаю без использования GPU сложно решить.

Буду рад услышать от читателей интересные идеи по тестированию различных моделей на обычных ПК и их сравнение с результатами обработки на мощных системах.

Источник

Возможности рынка
Логотип NodeAI
NodeAI Курс (GPU)
$0.02274
$0.02274$0.02274
+1.11%
USD
График цены NodeAI (GPU) в реальном времени
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу crypto.news@mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Вам также может быть интересно

Иран требует Bitcoin за проход через Ормузский пролив, пока MicroStrategy возобновляет покупки

Иран требует Bitcoin за проход через Ормузский пролив, пока MicroStrategy возобновляет покупки

Иран вводит обязательный сбор в размере $1 за баррель в Bitcoin для танкеров в Ормузском проливе, в то время как MicroStrategy добавляет 4 871 BTC в свою огромную корпоративную казну
Поделиться
CryptoPress2026/04/11 07:16
Криптоновости: Япония одобрила законопроект, классифицирующий криптовалюту как финансовый инструмент

Криптоновости: Япония одобрила законопроект, классифицирующий криптовалюту как финансовый инструмент

Ключевые моменты: Япония утвердила законопроект, классифицирующий криптоактивы как финансовые инструменты. Кабинет министров одобрил поправку в пятницу в рамках Финансового
Поделиться
Themarketperiodical2026/04/11 07:34
RaveDAO взлетает на 60% при рыночной капитализации свыше $370 млн: Анализ On-Chain

RaveDAO взлетает на 60% при рыночной капитализации свыше $370 млн: Анализ On-Chain

RaveDAO привлек внимание рынка благодаря впечатляющему росту цены на 60% за 24 часа, увеличив свою рыночную капитализацию до 372 миллионов $ и заняв #118
Поделиться
Blockchainmagazine2026/04/11 07:07

Генезис USD1: 0% + 12% APR

Генезис USD1: 0% + 12% APRГенезис USD1: 0% + 12% APR

Новые пользователи: Стейкайте и получите до 600% APR