🔬 Nghiên cứu mới đề xuất Scalable Power Sampling – phương pháp tăng cường suy luận cho LLM mà không cần huấn luyện lại hay bộ kiểm tra. Dựa trên làm sắc nét phân phối năng lượng, thay thế RL và MCMC, giảm thời gian suy luận >10x và đạt hiệu năng tương đương hoặc vượt GRPO một‑shot trên các tác vụ toán, QA, code. #AI #LLM #MachineLearning #DeepLearning #NghiênCứu #AI_VN #LLM_VN
https://www.reddit.com/r/LocalLLaMA/comments/1qsaath/scalable_power_sampling_unlocking_efficient/