fly51fly (@fly51fly)
Back to Blackwell 논문은 다목적(다중 목표) 선호도 파인튜닝에서 발생하는 비추이성(intransitivity) 문제를 다시 분석하고 이를 닫는(해결하는) 루프를 제안합니다. CMU 연구진이 제시한 이 작업은 선호도 기반 파인튜닝의 일관성과 안정성을 개선하려는 기법적·이론적 기여를 담고 있어 인공지능 시스템의 윤리적·실무적 튜닝에 영향을 줄 수 있습니다.
https://x.com/fly51fly/status/2028226915094696202
#preferencelearning #finetuning #multiobjective #intransitivity
