GPT-OSS-20B / 120B: Сухие цифры после реальных тестов

GPT-OSS - тесты на реальном железе: производительность моделей 20B и 120B на RTX 4090, RTX 5090 и H100. Реальные метрики TPS, сравнение скорости генерации и практические выводы о том, какую модель выбрать для локального использования.

https://habr.com/ru/articles/938960/

#GPTOSS20B #GPTOSS120B #TPS_токены_в_секунду #RTX_4090_vs_RTX_5090 #Ollama #H100_PCIe #llm #локальная_LLM #VRAM_использование #vllm

GPT-OSS-20B / 120B: Сухие цифры после реальных тестов

OpenAI выпустила GPT-OSS модели ( https://huggingface.co/openai/gpt-oss-20b и https://huggingface.co/openai/gpt-oss-120b ) , и сообщество немедленно начало экспериментировать. Но реальные бенчмарки...

Хабр