Perplexity (@perplexity_ai)
GB200과 H200의 성능 비교 결과를 제시했다. NVLS all-reduce 지연시간과 MoE prefill/ combine 시간이 크게 줄었고, 디코드 단계에서도 고토큰 속도에서 더 높은 처리량을 유지해 대규모 모델 추론 성능 개선이 확인됐다.
Perplexity (@perplexity_ai)
GB200과 H200의 성능 비교 결과를 제시했다. NVLS all-reduce 지연시간과 MoE prefill/ combine 시간이 크게 줄었고, 디코드 단계에서도 고토큰 속도에서 더 높은 처리량을 유지해 대규모 모델 추론 성능 개선이 확인됐다.
Perplexity (@perplexity_ai)
Qwen3 235B 후학습 모델을 NVIDIA GB200 NVL72 Blackwell 랙에서 서빙하는 방법에 대한 새로운 연구를 공개했다. GB200은 대규모 MoE 모델의 고처리량 추론에서 Hopper 대비 큰 성능 향상을 보이며, 학습뿐 아니라 추론 플랫폼으로서도 중요성이 강조됐다.
https://winbuzzer.com/2026/02/02/nvidia-gb200-forces-chassis-sector-pivot-to-liquid-cooling-xcxwbn/
Nvidia GB200 Forces Chassis Sector Pivot to Liquid Cooling
#AI #AIChips #AIInfrastructure #NVIDIA #GB200 #Semiconductors #Datacenters #BigTech
Discover how NVIDIA's Blackwell NVL72 powers top AI models like Kimi K2 Thinking 10x faster #MixtureOfExperts #NVIDIA #AI
The top 10 most intelligent open-source models, including Kimi K2 Thinking and DeepSeek-R1, utilize a mixture-of-experts (MoE) architecture, which mimics the human brain's efficiency. These models achieve a 10x speed increase when run on NVIDIA's GB200 NVL72, specifically the Blackwell NVL72. The MoE architecture is a key...
"#Huawei #AI CloudMatrix 384 – #China’s Answer to #Nvidia #GB200 NVL72 China Abundance of Power, 100% Optics, 0% Copper, Power Inefficiency, 2.6x lower FLOP per Watt, 14 Transceivers per Chip, Linear Pluggable Optics
300 PFLOPs of dense BF16 compute, almost double that of the GB200 NVL72. ... 3.6x aggregate memory capacity and 2.1x more memory bandwidth, Huawei and China ... can beat Nvidia’s."
https://semianalysis.com/2025/04/16/huawei-ai-cloudmatrix-384-chinas-answer-to-nvidia-gb200-nvl72/
The technology boycott works...
Huawei CloudMatrix 384 AI Cluster Outperforms Nvidia GB200
#Huawei #AI #AIChips #CloudMatrix #Ascend910C #Ascend920 #Nvidia #GB200 #AITraining #DataCenter #Supercomputing #Semiconductors #TechWar #USChina #ExportControls #OpticalNetworking #LPO #HBM
https://winbuzzer.com/2025/04/20/huawei-cloudmatrix-384-ai-cluster-outperforms-nvidia-gb200-xcxwbn/