Adina Yakup (@AdinaYakup)

GAIR가 Human Centric Audio-Video Generative Model인 daVinci-MagiHuman을 공개했다. 15B 규모의 완전 오픈소스 모델로, 텍스트·비디오·오디오를 통합해 6개 언어를 지원하며 H100 한 대에서 5초 1080p 영상을 38초에 생성한다고 소개했다.

https://x.com/AdinaYakup/status/2036398402284495216

#gair #opensource #videogeneration #audiovideo #generativemodel

Adina Yakup (@AdinaYakup) on X

daVinci-MagiHuman 🎬 Human Centric Audio-Video Generative Model by GAIR Model: https://t.co/5ZJJYegEil Paper: https://t.co/5ZJJYegEil ✨ 15B – Fully open source! ✨ 5-sec 1080p video in 38s on one H100 ✨ Supports 6 languages ✨ Unified model with text + video + audio

X (formerly Twitter)