Nathan Lambert (@natolambert)
저자가 책과 함께 무료 RLHF 코스를 공개했다. 웰컴 영상과 함께 RLHF 및 Post-training 개요, IFT, Reward Models, Rejection Sampling, RL 수학, RL 구현 등 핵심 강의가 순차적으로 제공된다. AI 모델 정렬과 포스트 트레이닝 학습에 유용한 교육 자료 공개로 볼 수 있다.

Nathan Lambert (@natolambert) on X
Excited to launch the accompanying free RLHF Course for my book. To kick it off, I've released: - Welcome video - Lecture 1: Overview of RLHF & Post-training - Lecture 2: IFT, Reward Models, Rejection Sampling - Lecture 3: RL Math - Lecture 4: RL Implementation I'm going to add








