Có phiên bản GGUF Q4_0 mới cho Gemma‑3 1B‑it‑qat, không dùng imatrix và đã sửa metadata token. Nhỏ hơn, nhanh hơn, hỗ trợ `<end_of_turn>` và các token CONTROL. Được tạo bằng llama.cpp b7699, dựa trên google/gemma‑3‑1b‑it‑qat‑q4_0‑unquantized. Hữu ích cho ai dùng model 1B. #AI #MachineLearning #Gemma3 #LLM #Vietnam #CôngNghệ #ModelQuantization #ML #OpenSource
https://www.reddit.com/r/LocalLLaMA/comments/1qbm7f4/gemma_3_1b_qat_q4_0_gguf_without_imatrix_and/