fly51fly (@fly51fly)
멀티모달 모델의 테스트 시점 강화학습을 스스로 개선하는 메타인지 프레임워크 ‘Meta-TTRL’ 논문이 공개됐다. 통합 멀티모달 모델의 추론·적응 능력을 향상시키는 자기개선형 학습 방식으로, 최신 AI 학습 프레임워크 연구로 주목된다.
https://x.com/fly51fly/status/2034383972177002605
#multimodal #reinforcementlearning #metacognition #framework #arxiv





