50 tokens/giây có tốt không? Một người dùng chia sẻ trải nghiệm chạy Llama3.2 trên điện thoại qua Termux, đạt ~50 TPS. Đây là lần đầu họ chạy AI cục bộ. Liệu tốc độ này có cao? #LocalLLaMA #TokensPerSecond #AIandML #TỷLệTokenGiây #HọcMáy #CôngNghệAI
https://www.reddit.com/r/LocalLLaMA/comments/1qqi7zj/is_50tps_good/