Các vấn đề với glm-4.7-flash khi gọi công cụ trong pha suy luận. Người dùng thử nghiệm các phiên bản FP8, AWQ 4-bit và 8-bit nhưng mô hình dừng sau 0-2 lần gọi. Cần hướng dẫn khắc phục. #AI #ML #GLM4_7 #MáyHọc #CôngNghệAI
https://www.reddit.com/r/LocalLLaMA/comments/1qq8zrt/glm47flash_tool_calls_in_reasoning_block/
