Rohan Paul (@rohanpaul_ai)
새 논문은 로봇이 시연을 단순히 모방하는 대신 도달 가능한 중간 목표(stepping stone goals)로 변환해 장기 과제를 학습할 수 있음을 보입니다. 제안된 방법 'Cago'(Capability Aware Goal Sampling)는 에이전트가 도달 가능한 서브골을 추적·선택하도록 하여 장기 과제 완료율을 높이고 기존 모방학습의 한계를 완화합니다.

Rohan Paul (@rohanpaul_ai) on X
This paper shows how robots can learn long tasks by turning demonstrations into reachable stepping stone goals instead of copying actions. Cago, short for Capability Aware Goal Sampling, helps agents finish long tasks by chasing reachable subgoals. Standard imitation learning

(Akkoma)
