GPT-OSS-20B / 120B: Сухие цифры после реальных тестов
GPT-OSS - тесты на реальном железе: производительность моделей 20B и 120B на RTX 4090, RTX 5090 и H100. Реальные метрики TPS, сравнение скорости генерации и практические выводы о том, какую модель выбрать для локального использования.
https://habr.com/ru/articles/938960/
#GPTOSS20B #GPTOSS120B #TPS_токены_в_секунду #RTX_4090_vs_RTX_5090 #Ollama #H100_PCIe #llm #локальная_LLM #VRAM_использование #vllm