Kosseila (CloudDude) (@CloudDude_)
DeepSeek 관련 업데이트로 보이는 게시물: DeepSeek v3.2는 643GB 규모의 가중치로, 16개 GPU(2× H100 노드)로 운영되며 KubeRay로 자동화되어 배포되었다고 공유합니다(텐서 병렬 TP=8, 파이프라인 병렬 PP=2). 대규모 모델 운영 스펙을 공개하는 내용입니다.
Kosseila (CloudDude) (@CloudDude_)
DeepSeek 관련 업데이트로 보이는 게시물: DeepSeek v3.2는 643GB 규모의 가중치로, 16개 GPU(2× H100 노드)로 운영되며 KubeRay로 자동화되어 배포되었다고 공유합니다(텐서 병렬 TP=8, 파이프라인 병렬 PP=2). 대규모 모델 운영 스펙을 공개하는 내용입니다.