AISatoshi (@AiXsatoshi)

GLM-5-UD-Q4_K_XL 모델을 자택 단일 노드에서 20 tok/s, 2노드에서 27 tok/s로 측정했다는 벤치마크 결과 공유. '터보' 변형도 시도해보고 싶다는 코멘트가 포함되어 있습니다.

https://x.com/AiXsatoshi/status/2033390609701167118

#glm5 #benchmark #inference #quantization

AI✖️Satoshi⏩️ (@AiXsatoshi) on X

GLM-5-UD-Q4_K_XL 自宅のシングルノードで20tok/s、2ノードで27tok/sだった。ターボも動かしてみたい

X (formerly Twitter)