merve (@mervenoyann)

AI2(Allen Institute for AI)가 포인팅(pointing) 작업에서 SOTA 성능을 목표로 한 새로운 비전 언어 모델 패밀리 'MolmoPoint'를 공개함. 공개된 모델은 MolmoPoint-8B(범용), MolmoPoint-GUI-8B(그래픽 UI용), MolmoPoint-Vid-4B(비디오 내 계수/추적)이며, 관련 데이터셋도 함께 제공됨.

https://x.com/mervenoyann/status/2034343677116531005

#ai2 #molmopoint #visionlm #datasets #sota

merve (@mervenoyann) on X

AI2 released new family of vision LMs for pointing (SOTA!) 🔥 > MolmoPoint-8B (general use) > MolmoPoint-GUI-8B (graphical computer use) > MolmoPoint-Vid-4B (counting/tracking in videos) also with their datasets 🥵

X (formerly Twitter)