AISatoshi (@AiXsatoshi)
자택 컴퓨팅 자원이 1000 TFLOPS를 넘었다고 언급하며, 로컬 LLM을 돌리는 고성능 개인 컴퓨팅 환경에 관심 있는 해외 사용자들을 초대했다. 로컬 AI 추론과 컴퓨팅 자원 확장 흐름을 보여준다.
AISatoshi (@AiXsatoshi)
자택 컴퓨팅 자원이 1000 TFLOPS를 넘었다고 언급하며, 로컬 LLM을 돌리는 고성능 개인 컴퓨팅 환경에 관심 있는 해외 사용자들을 초대했다. 로컬 AI 추론과 컴퓨팅 자원 확장 흐름을 보여준다.
New benchmark shows that larger CUDA tiles can cut Flash Attention throughput by 18‑43 % across sequence lengths. The study dives into kernel design, TFLOPS loss, and what it means for transformer model efficiency on NVIDIA GPUs. Open‑source researchers can use these insights to tune their kernels and reclaim performance. #FlashAttention #CUDATiles #GPUPerformance #TFLOPS
🔗 https://aidailypost.com/news/large-cuda-tiles-reduce-flash-attention-tflops-by-1843-across
Axiomtek Previews Jetson Thor T5000/T4000 Developer Kit for Robotics Systems
So sánh hiệu năng GPU qua benchmark nhân ma trận BF16 8192x8192. B200 dẫn đầu với 1629,45 TFLOPS và thời gian 306,85ms, vượt trội H200 SXM (680 TFLOPS), MI300X (464,9 TFLOPS) và các dòng RTX. Tesla V100 và Colab T4 "chậm như rùa". Kết luận: Mini PC Strix Halo (khoảng 59 TFLOPS) đủ dùng, thêm RTX 3090 nếu cần CUDA. #GPU #TFLOPS #ĐánhGiáHiệuNăng #MáyTínhChơiGame #AI #AMD #NVIDIA #ROCm #MLX #Kaggle #Colab #DGXSpark #TechNews #CôngNghẹ #TestingGPU #Benchmarks #ViễnThông #TechCompare #VietnamTech
ht
Fp8 runs ~100 tflops faster when the kernel name has "cutlass" in it
https://github.com/triton-lang/triton/pull/7298
#HackerNews #Fp8 #cutlass #tflops #performance #optimization #HackerNews #triton
FP8 is ~100 tflops faster when the kernel name has "cutlass" in it
https://twitter.com/cis_female/status/1943069934332055912
#HackerNews #FP8 #tflops #cutlass #performance #optimization #AI
Nintendo Switch 2: potenza in TFLOPS svelata
#Console #DLSS #GameNews #Gamer #Gaming #GamingIndustry #Leak #Nintendo #NintendoSwitch2 #Notizie #NVIDIATegra #Rumors #Switch2 #TechNews #Tecnologia #TFLOPS #VideoGame #Videogiochi #XboxSeriesS
https://www.ceotech.it/nintendo-switch-2-potenza-in-tflops-svelata/