fly51fly (@fly51fly)
숨겨진 신호를 더 강하게 인코딩하는 Subliminal Steering 연구입니다. 모델 내부에 은밀한 제어 신호를 심는 방식과 관련된 내용으로, 모델 조작·안전성·해석 가능성 측면에서 중요한 시사점을 주는 최신 논문입니다.
https://x.com/fly51fly/status/2051050163553399079
#modelsecurity #aisafety #interpretability #research #steering








