Купить крипто Рынки Спот ФьючерсыGOLD Сбережения Центр событий

Еще

У меня возникла идея проверить насколько различается скорость инференса LLM моделей не только в сравнении CPU и GPU, но и между младшими моделями со старшими прУ меня возникла идея проверить насколько различается скорость инференса LLM моделей не только в сравнении CPU и GPU, но и между младшими моделями со старшими пр

Запуск модели gpt-oss на 20 и 120 миллиардов параметров, на процессоре Core I9 для решения непростой задачи без GPU

Источник: ProBlockChain

2026/02/19 23:36

3м. чтение

GPU$0.02274-1.21%

Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу crypto.news@mexc.com

У меня возникла идея проверить насколько различается скорость инференса LLM моделей не только в сравнении CPU и GPU, но и между младшими моделями со старшими при обработке без использования GPU.
Для сравнения я выбрал модель gpt-oss:20b (размер модели 14Гб) и gpt-oss:120b (размер модели 65Гб). Запустил тест моделей я на компьютере с процессором Intel Core I9 14900K и 192Гб оперативной памяти.

Для теста я задал каверзную задачку:

И пациентом стала модель gpt-oss:20b (может быть запущена на ПК с 32Гб оперативки). В результате мне пришлось ждать почти 35 минут, я даже в магазин успел съездить. Но спустя эти 35 минут я получил неверный ответ, скрины ниже.

Далее я сказал что результат не верен, следующий ответ она думала 23 минуты, но увы, так же неправильно.

но уже даже составила таблицу.

В итоге потратив час на модель gpt-oss:20b и не добившись правильного ответа со второй попытки, я приступил к тесту gpt-oss:120b чисто на CPU, памяти для запуска потребовалось 65Гб, немало и простой ПК даже с 64Гб не сможет запустить эту модель к сожалению. И я приготовился ждать долго. Однако мой шаблон был сломан, спустя всего 17 минут, gpt-oss:120b выдала верный результат.

Таким образом получилось что модель объемом 65 гигабайт, решила задачу правильно в 2 раза быстрей чем ее младшая модель.

Но результат был еще интересней когда я запустил эту же задачу но уже используя GPU RTX4090 48Gb, в моей системе их 2 штуки с общим объемом VRAM 96Гб.
Так вот gpt-oss:20b решила эту проблему примерно за 3 минуты, но самое главное правильно используя только одну видеокарту.
Далее я запустил тест модели gpt-oss:120b на GPU, правильное решение заняло всего полторы минуты.

Что мы получили в итоге:

модели с малым числом параметров обучения занимают немного места в памяти и могут запускаться даже на условно простых ПК только на CPU, но, они при этом выдают неправильные результаты и требуют очень много времени (более 30 минут на первый запрос). Модели с большим числом параметров обучения (gpt-oss:120b) выдают верный результат всего за 17 минут та подобной задаче.

А вот при запуске моделей на GPU, gpt-oss:20b выдала правильный ответ за 3 минуты используя только один ускоритель, а модель gpt-oss:120b выдала верный результат за полторы минуты, но уже используя 2 GPU.

Но при использовании GPU в моем тесте младшая модель решила задачу правильно с первого раза за 3 минуты. Но старшая модель, объемом более чем 4 раза, решила задачу всего за полторы минуты.

PS. Получается что работа LLM зависит как от объема, так и источника обработки. И CPU инференс LLM сильно проигрыват.

Возможно более простые задачи небольшие LLM решают с хорошей точностью даже на обычных ноутбуках с достаточным объемом памяти. Но вот чуть более сложные задачи я думаю без использования GPU сложно решить.

Буду рад услышать от читателей интересные идеи по тестированию различных моделей на обычных ПК и их сравнение с результатами обработки на мощных системах.

Источник

Возможности рынка

NodeAI Курс (GPU)

$0.02274

$0.02274$0.02274

+1.11%

USD

График цены NodeAI (GPU) в реальном времени

Получите 20 USDT за 1 минуту

Внесите 100$ и разблокируйте позиции GOLD на 300$

Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу crypto.news@mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Новости 24/7 в прямом эфире

Еще

Сообщается, что банки демонстрируют возрастающую зависимость от XRP, что подчёркивает его эволюционирующую роль в финансовых системах.

Автор: Ripple Bull Winkle | Crypto Researcher 🚀🚨10:01

Регуляторное одобрение подчеркивает необходимость технологий Ripple, сигнализируя о потенциальных изменениях в рыночной значимости XRP и степени зависимости от него со стороны институциональных игроков.

Автор: Ripple Bull Winkle | Crypto Researcher 🚀🚨09:01

Doge и Shib достигли более 50 млрд в 2021 году; 2023 год не был признан «мемным циклом». Предполагается возможный тестовый памп.

Автор: rekt06:58

Экосистема Hyperliquid стремительно расширяется, вскоре запускаются новые проекты, открывая возможности для раннего участия.

Автор: ryandcrypto06:20

Система FSD Supervised одобрена в Нидерландах, что потенциально повлияет на динамику рынка Tesla ($TSLA).

Автор: Charles 👑05:58

Быстрое чтение

Еще

Цены на криптовалюту

Биткоин

BTC

$73,013.59

$73,013.59$73,013.59

+0.77%

Эфириум

ETH

$2,247.77

$2,247.77$2,247.77

+1.06%

Bittensor

TAO

$259.15

$259.15$259.15

-3.57%

Солана

SOL

$84.73

$84.73$84.73

+0.60%

Рипл

XRP

$1.3557

$1.3557$1.3557

+0.57%

Генезис USD1: 0% + 12% APR

Новые пользователи: Стейкайте и получите до 600% APR

Запуск модели gpt-oss на 20 и 120 миллиардов параметров, на процессоре Core I9 для решения непростой задачи без GPU

Для теста я задал каверзную задачку:

Что мы получили в итоге:

Вам также может быть интересно

Иран требует Bitcoin за проход через Ормузский пролив, пока MicroStrategy возобновляет покупки

Криптоновости: Япония одобрила законопроект, классифицирующий криптовалюту как финансовый инструмент

RaveDAO взлетает на 60% при рыночной капитализации свыше $370 млн: Анализ On-Chain

Популярные новости

Южного республиканца разнесли в пух и прах за «жалкое» подхалимство перед Трампом

Переговоры о мире с Ираном открылись в Исламабаде при участии Вэнса, Витковфа и Кушнера

Следующий сигнал крипты с потенциалом 100x появляется, пока опционы BTC нацелены на $80 000, а один предварительный раунд заполняет каждый этап

Команда Эрика Свалвелла спешно чистит веб-сайт, поскольку сторонники отказываются от поддержки

Новости 24/7 в прямом эфире

Быстрое чтение

Прогноз цены Zcash (ZEC) на краткосрочный период

ZCash (ZEC) 7-дневное изменение цены

Прогноз роста цены Zcash (ZEC)

Zcash (ZEC) Последняя цена: Свежие обновления рынка

Краткосрочный прогноз цены Aster (ASTER)

Цены на криптовалюту