Tencent HY (@TencentHunyuan)
WorldCompass라는 RL 포스트트레이닝 프레임워크를 오픈소스로 공개했다는 발표입니다. Interactive World Models 전용으로 설계된 포스트트레이닝 프레임워크이며, 사용자 데이터·보상·기반 모델로 커스터마이즈 가능한 오픈 트레이닝 코드와 보다 정밀한 오픈소스 체크포인트를 함께 제공한다고 설명합니다.
https://x.com/TencentHunyuan/status/2031215778977165508
#worldcompass #reinforcementlearning #rl #opensource #interactiveworldmodels

Tencent HY (@TencentHunyuan) on X
We are open-sourcing WorldCompass, an RL post-training framework specifically designed for Interactive World Models. 🛠️ Open Training Code: Fully customizable for post-training with your own data, rewards, or base models. ⚡ Open-source Checkpoint: More precise