NVIDIA (@nvidia)
NVIDIA는 MLPerf Inference v6.0에서 극한 수준의 공동 설계를 통해 다양한 모델에서 최고 토큰 출력 성능을 달성했다고 강조했다. AI 팩토리 생산성은 칩 사양보다 실제 성능이 더 중요하다는 메시지다.

NVIDIA (@nvidia) on X
Delivered performance, not peak chip specifications, drives AI factory productivity. Rigorous benchmarks are the only way to see past the noise. In MLPerf Inference v6.0, NVIDIA extreme co-design delivered the highest token output across the broadest range of models and