Ilir Aliu (@IlirAliu_)

Direct Video-Action Models(DVA)는 로봇 제어를 비디오 생성 문제로 보고, 생성된 비디오를 행동으로 번역하는 새로운 접근입니다. @rhoda_ai_가 개발했으며 인과적(causal) 비디오 모델을 처음부터 사전학습(pretrain)해 복잡한 로봇 작업을 실행할 수 있다고 설명합니다. 로봇제어와 비디오 생성 모델을 결합한 연구·시스템 발표로 평가됩니다.

https://x.com/IlirAliu_/status/2032742738853048413

#robotics #videomodels #robotcontrol #causalmodels

Ilir Aliu (@IlirAliu_) on X

Learning from robot data? Standard. Direct Video-Action Models (DVA) is different: treat robot control as video generation, then translate the generated video into actions. Built by @rhoda_ai_, the system pre-trains causal video models from scratch and can run complex

X (formerly Twitter)