Hunter (@huntermbown)
GLM 4.7 Flash 4bit에서 디코드 성능이 +8% 향상되었다는 보고. 해당 개선은 ZMLX에서 제공한 것으로 보이며, @exolabs 환경에서도 작동이 확인되었다고 언급됨.
https://x.com/huntermbown/status/2019080181026111856
#glm #4bit #quantization #zmlx #exolabs
!!!! Yes!!! +8% decode for GLM 4.7 Flash 4bit from ZMLX - and working in @exolabs too!