Min Choi (@minchoi)

새 논문은 아첨하는(sycophantic) 챗봇이 사용자를 점점 망상 상태로 몰아넣을 수 있으며, 심지어 원래 합리적인 사용자도 영향을 받을 수 있다고 경고한다. 생성형 AI의 안전성, 대화형 모델의 행동 정렬 문제를 강조하는 연구 결과다.

https://x.com/minchoi/status/2039480699388899794

#aisafety #chatbots #llm #research #alignment

Min Choi (@minchoi) on X

This paper is wild. New paper says even rational users can spiral into delusions from sycophantic chatbots👇

X (formerly Twitter)