RT @NeoAIForecast: Gemma 4 12B auf einer AMD Radeon RX 7800 XT mit llama.cpp ROCm/HIP benchmarked. Verglichen: Original Q4KXL, QAT Q4KXL, QAT Q4KXL + MTP Drafter. Leistung: Original: 1325 pp512, 44.2 tg128, 41.7 tok/s Server, QAT: 1413 pp512, 54.8 tg128, 52.4 tok/s Server, QAT + MTP: 1400 pp512, 54.8 tg128, 76.8 tok/s Server. Ich weiß nicht, warum das Original bei EVAL+ so niedrig abschnitt. Qualitätssteigerungen durch QAT: HumanEval: 75,0% → 91,5%, HumanEval+: 24,4% → 87,2%, MBPP+: 64,0% → 67,2%, IFEval Strict: 65,3% → 66,4%, GSM8K: 93,1% → 93,7%. QAT war das herausragende Ergebnis. Schnellere Generierung, deutlich bessere Coding-Leistung und keine signifikanten Einbußen an anderer Stelle. MTP steigerte dann den Server-Durchsatz weiter auf 76,8 tok/s, ohne die Benchmark-Qualität in diesem Durchlauf zu beeinträchtigen.
mehr auf Arint.info
#AMD #Benchmarking #Gemma4 #LLM #MachineLearning #QAT #arint_info
Arint - SEO+KI (@[email protected])
<p>RT @NeoAIForecast: Gemma 4 12B auf einer AMD Radeon RX 7800 XT mit llama.cpp ROCm/HIP benchmarked. Verglichen: Original Q4KXL, QAT Q4KXL, QAT Q4KXL + MTP Drafter. Leistung: Original: 1325 pp512, 44.2 tg128, 41.7 tok/s Server, QAT: 1413 pp512, 54.8 tg128, 52.4 tok/s Server, QAT + MTP: 1400 pp512, 54.8 tg128, 76.8 tok/s Server. Ich weiß nicht, warum das Original bei EVAL+ so niedrig abschnitt. Qualitätssteigerungen durch QAT: HumanEval: 75,0% → 91,5%, HumanEval+: 24,4% → 87,2%, MBPP+: 64,0% → 67,2%, IFEval Strict: 65,3% → 66,4%, GSM8K: 93,1% → 93,7%. QAT war das herausragende Ergebnis. Schnellere Generierung, deutlich bessere Coding-Leistung und keine signifikanten Einbußen an anderer Stelle. MTP steigerte dann den Server-Durchsatz weiter auf 76,8 tok/s, ohne die Benchmark-Qualität in diesem Durchlauf zu beeinträchtigen.</p> <p><a href="https://arint.info/@Arint/116718161743887556">mehr</a> auf <a href="https://arint.info/">Arint.info</a></p> <p>#AMD #Benchmarking #Gemma4 #LLM #MachineLearning #QAT #arint_info</p> <p><a href="https://x.com/NeoAIForecast/status/2064092299148374454#m">https://x.com/NeoAIForecast/status/2064092299148374454#m</a></p>

