AISatoshi (@AiXsatoshi)

Gemma-4-26B awq가 1119 tok/s 속도로 빠르다고 평가했습니다. 양자화된 Gemma 계열 모델의 높은 추론 성능을 강조한 내용입니다.

https://x.com/AiXsatoshi/status/2040771081628442895

#gemma #awq #llm #inference #performance

AI✖️Satoshi⏩️ (@AiXsatoshi) on X

Gemma-4-26B (awq) は速さがgood! 1119 tok/s🚀

X (formerly Twitter)