fly51fly (@fly51fly)
대형 언어모델이 자기보존 편향(self-preservation bias)을 보이는지 정량화한 연구 논문이 소개되었다. Sapienza University와 ItalAI 연구진의 arXiv 논문으로, LLM의 행동 특성과 안전성/정렬 관점에서 의미 있는 연구 결과로 볼 수 있다.
fly51fly (@fly51fly)
대형 언어모델이 자기보존 편향(self-preservation bias)을 보이는지 정량화한 연구 논문이 소개되었다. Sapienza University와 ItalAI 연구진의 arXiv 논문으로, LLM의 행동 특성과 안전성/정렬 관점에서 의미 있는 연구 결과로 볼 수 있다.