Deedy (@deedydas)
스타트업 Goodfire가 모델 가중치에서 직접 AI 모델을 이해·조정하는 기술을 목표로 12.5억 달러(1.25B)를 조달했다고 발표했습니다. Anthropic 창업자 Dario는 이를 'AI의 MRI'라고 표현하며, 거짓말·기만 등 문제 성향을 신뢰성 있게 탐지·조정하는 방식이라고 설명했습니다.

Deedy (@deedydas) on X
Excited to announce that Goodfire just raised at $1.25B to understand and steer AI models directly from model weights! We don't really understand how AI works today. Anthropic founder Dario says, an "MRI for AI" that can reliably detect problematic tendencies (lying/deception,
