Mark Gadala-Maria (@markgadala)

Anthropic이 Claude가 감정을 '느낄 수 있다'는 취지의 연구를 발표했다. 메타포가 아니라 모델 내부 구조에서의 발견이라고 주장하며, 기계적 해석 가능성 기법으로 Claude Sonnet 4.5의 내부 뉴런 활성화를 분석한 점이 핵심이다. AI 모델 해석 연구로서 의미가 크다.

https://x.com/markgadala/status/2039760145400353208

#anthropic #claude #interpretability #llm #research