Qwen3-Next mới ra: Qwen3-Next-80B-A3B tích hợp Hybrid Attention (DeltaNet + Attention), MoE Sparsity cao, tối ưu ổn định và Multi-Token Prediction. Xử lý văn bản dài 50k tokens như "Alice in Wonderland" mượt mà, tốc độ ~40t/s trên W7900 48GB. Cần Ollama 0.13.2. #AI #Qwen3Next #TríTuệNhânTạo #Ollama
https://www.reddit.com/r/ollama/comments/1pi5fr6/qwen3next_here/