PowerInfer đề xuất kiến trúc dị biệt xử lý "neuron nóng" trên NPU và "neuron lạnh" trên CPU, giúp chạy mô hình 120B trên thiết bị nhỏ như TiinyAI với chỉ 30W. Công nghệ này có thể phá vỡ giới hạn bộ nhớ, mở đường cho AI cục bộ mạnh mẽ trên thiết bị hạn chế RAM. Liệu đây có phải tương lai của AI biên? #PowerInfer #EdgeAI #AI #LocalLLM #TríTuệNhânTạo #AIcụcbộ
https://www.reddit.com/r/LocalLLaMA/comments/1qo2s53/thoughts_on_powerinfer_as_a_way_to_break_the/
