NVIDIA công bố kết quả fine‑tune Llama 3.3 70B trên DGX Spark dùng QLoRA: tối đa 5 079 token/s (Pytorch, seq = 2048, batch = 8, epoch = 1). Với 100 M token, thời gian ước ~5.5 h. Bạn có thấy hiệu suất này realistic? #NVIDIA #GPU #LLM #FineTuning #ĐaiBộ #GPUĐàoTạo #LLMFineTuning #AI #DeepLearning #Technologiviet 🌐💻

https://www.reddit.com/r/LocalLLaMA/comments/1ptzb5y/finetuning_llms_on_dgx_spark_from_nvidia_webpage/