🆕 EXAONE MoE đã được tích hợp vào llama.cpp!
🔹 K‑EXAONE 236 B (23 B hoạt động) sử dụng kiến trúc Mixture‑of‑Experts, hỗ trợ 256K token và tăng tốc inference ≈1.5× nhờ Multi‑Token Prediction.
🔹 Đa ngôn ngữ (Korean, English, Spanish, German, Japanese, Vietnamese) với vocab 150k SuperBPE, giảm token ≈30%.
🔹 Khả năng agentic, công cụ, và an toàn cao, tích hợp bối cảnh văn hoá Hàn Quốc.
#EXAONE #llamacpp #AI #LLM #Vietnamese #Multilingual #MoE #AIResearch
