Cursor (@cursor_ai)

Blackwell GPU에서 MoE 모델의 토큰 생성 방식을 재구성해 추론 속도를 1.84배 높이고 출력 정확도도 개선했다. 이 개선은 Composer 학습에도 직접 반영되어, 더 자주 향상된 모델 버전을 배포할 수 있게 한다.

https://x.com/cursor_ai/status/2041260649267986643

#moe #blackwell #inference #gpu #llm

Cursor (@cursor_ai) on X

We rebuilt how MoE models generate tokens on Blackwell GPUs, resulting in 1.84x faster inference and more accurate outputs. These improvements directly contribute to how we train Composer, allowing us to ship improved versions of the model more often.

X (formerly Twitter)