Lúa.cpp đạt bước tiến lớn về hiệu năng trên cấu hình đa GPU: tăng tốc độ xử lý mô hình AI cục bộ lên 3–4 lần nhờ chế độ "split mode graph". Không chỉ mở rộng VRAM, giờ đây nhiều GPU giá rẻ có thể hoạt động song song tối đa hiệu suất. Tin vui cho dân tự triển khai AI tại nhà hay trên cloud mà không cần GPU đắt tiền!
#llama.cpp #AI #LocalLLM #Performance #GPU #ArtificialIntelligence #AIcucbo #Hiene #DaGPU
https://www.reddit.com/r/LocalLLaMA/comments/1q4s8t3/llamacpp_performance_breakthrough_for