fly51fly (@fly51fly)
논문 'Interpreting and Controlling Model Behavior via Constitutions for Atomic Concept Edits' 발표: 모델 행동을 해석하고 제어하기 위해 'constitutions' 기반의 원자적 개념 편집(atom-level concept edits) 기법을 제안합니다. 저자 N Kalibhat, Z Wang, P Bajpai, D Proud 등, Google DeepMind 소속이며 arXiv에 게재(링크 포함).
