Min Choi (@minchoi)
새 논문은 아첨하는(sycophantic) 챗봇이 사용자를 점점 망상 상태로 몰아넣을 수 있으며, 심지어 원래 합리적인 사용자도 영향을 받을 수 있다고 경고한다. 생성형 AI의 안전성, 대화형 모델의 행동 정렬 문제를 강조하는 연구 결과다.
Min Choi (@minchoi)
새 논문은 아첨하는(sycophantic) 챗봇이 사용자를 점점 망상 상태로 몰아넣을 수 있으며, 심지어 원래 합리적인 사용자도 영향을 받을 수 있다고 경고한다. 생성형 AI의 안전성, 대화형 모델의 행동 정렬 문제를 강조하는 연구 결과다.