AISatoshi (@AiXsatoshi)
Gemma-4-26B awq가 1119 tok/s 속도로 빠르다고 평가했습니다. 양자화된 Gemma 계열 모델의 높은 추론 성능을 강조한 내용입니다.
https://x.com/AiXsatoshi/status/2040771081628442895
#gemma #awq #llm #inference #performance
Gemma-4-26B (awq) は速さがgood! 1119 tok/s🚀