Prowl: Learning Through Discovery

PROWL은 강화학습(RL) 기반의 적대적 프레임워크로, RL 에이전트가 게임 환경을 탐색하며 월드 모델의 실패 사례를 발견하고 이를 학습 커리큘럼으로 활용해 모델 성능을 개선한다. Minecraft 환경에서 평가된 PROWL은 행동 추종 정확도, 시각적 품질, 환경 동역학 등에서 기존 모델 대비 우수한 성능을 보였으며, 점진적 난이도 조절을 통해 안정적인 적대적 학습 루프를 구현한다. 이 접근법은 월드 모델 개발에 자체 경험 생성과 피드백 루프를 도입해 물리 및 시각 모델링의 발전 가능성을 제시한다.

https://odyssey.ml/introducing-prowl

#reinforcementlearning #worldmodel #adversarialtraining #curriculumlearning #minecraft

Introducing PROWL: Learning Through Discovery

PROWL is a novel RL-driven adversarial framework where an RL agent explores game environments with the objective to improve world model performance.

Scaffolding to Superhuman: How Curriculum Learning Solved 2048 and Tetris | Kyoung Whan Choe

Nvdia und Stanford erfinden Cross-Episodic Curriculum - KiNews24.de

Nvdia und Stanford erfinden Cross-Episodic Curriculum: Forscher von Stanford, NVIDIA und der University of Texas stellen mit Cross-Episodic Curriculum (CEC) einen neuen KI-Algorithmus vor, der das Lernen und die Generalisierungsfähigkeit von Transformer-Agenten steigert.

KI NEWS24