NVIDIA TensorRT-LLM giới thiệu tính năng **AETHER-X** qua PR #10305, đạt **tăng tốc 4.9x trong inference** nhờ Adaptive POVM Kernels! Nhiều người ngạc nhiên vì cải tiến vượt trội thay vì chỉ sửa lỗi nhỏ. #TensorRTLLM #AIDeepLearning #AI #ML #DeepLearning #CôngNghệAI #ViễnTàiAI
https://www.reddit.com/r/LocalLLaMA/comments/1pxqbk4/uh_has_anyone_seen_pr_10305_on_tensorrtllm/
