Mastodawn

chatllm.cpp now hỗ trợ WeDLM, với các tùy chọn block_size, accept_algo, threshold, pos_penalty_factor. CPU tăng tốc ~50% khi sinh ~300 token, GPU không có cải thiện. Lưu ý mô hình nhạy cảm với tham số sampling. #AI #MachineLearning #NLP #chatllm #WeDLM #CôngNghệ