chatllm.cpp now hỗ trợ WeDLM, với các tùy chọn block_size, accept_algo, threshold, pos_penalty_factor. CPU tăng tốc ~50% khi sinh ~300 token, GPU không có cải thiện. Lưu ý mô hình nhạy cảm với tham số sampling. #AI #MachineLearning #NLP #chatllm #WeDLM #CôngNghệ

https://www.reddit.com/r/LocalLLaMA/comments/1qbme3t/chatllmcpp_support_of_wedlm/