merve (@mervenoyann)
Meta가 Sapiens2를 조용히 공개했다. 10억 장의 사람 이미지로 학습한 고해상도 비전 모델 패밀리로, 자세 추정, 신체 부위 분할, 표면 노멀, 포인트맵 등에서 SOTA 성능을 목표로 한다. 0.1B~5B까지 6가지 크기를 제공하며 1024×768과 4K 같은 고해상도 입력을 지원한다.
merve (@mervenoyann)
Meta가 Sapiens2를 조용히 공개했다. 10억 장의 사람 이미지로 학습한 고해상도 비전 모델 패밀리로, 자세 추정, 신체 부위 분할, 표면 노멀, 포인트맵 등에서 SOTA 성능을 목표로 한다. 0.1B~5B까지 6가지 크기를 제공하며 1024×768과 4K 같은 고해상도 입력을 지원한다.
merve (@mervenoyann)
메타가 Sapiens2를 공개한 것으로 보인다. 10억 장의 인간 이미지로 학습된 고해상도 모델 패밀리로, 자세 추정, 신체 부위 분할, 표면 법선, 포인트맵 등에서 SOTA를 내며 0.1B~5B 크기와 1024×768, 4K 해상도를 지원한다.
https://x.com/mervenoyann/status/2054187884417102319
#meta #sapiens2 #computervision #opensource #foundationmodel