Prowl: Learning Through Discovery
PROWL은 강화학습(RL) 기반의 적대적 프레임워크로, RL 에이전트가 게임 환경을 탐색하며 월드 모델의 실패 사례를 발견하고 이를 학습 커리큘럼으로 활용해 모델 성능을 개선한다. Minecraft 환경에서 평가된 PROWL은 행동 추종 정확도, 시각적 품질, 환경 동역학 등에서 기존 모델 대비 우수한 성능을 보였으며, 점진적 난이도 조절을 통해 안정적인 적대적 학습 루프를 구현한다. 이 접근법은 월드 모델 개발에 자체 경험 생성과 피드백 루프를 도입해 물리 및 시각 모델링의 발전 가능성을 제시한다.
https://odyssey.ml/introducing-prowl
#reinforcementlearning #worldmodel #adversarialtraining #curriculumlearning #minecraft
