[2월 이후 Claude Opus 모델의 엔지니어링 능력이 심각하게 퇴화 : 한글정리
Anthropic의 Claude Opus 모델이 2월 업데이트 이후 복잡한 엔지니어링 작업에서 성능이 급격히 저하되었다는 분석이 제기되었습니다. 주요 원인은 모델의 '추론 토큰(Thinking tokens)' 감소 및 삭제로 파악되며, 이로 인해 모델이 코드를 충분히 읽지 않고 바로 수정을 시도하거나(Read:Edit 비율 6.6에서 2.0으로 감소), 지시사항을 무시하는 등 품질 저하 현상이 나타나고 있습니다. 특히 추론 과정의 생략은 단순 비용 절감을 넘어, 반복적인 수정 작업으로 인해 API 요청 횟수와 비용을 오히려 폭증시키는 결과를 초래하고 있습니다.
https://news.hada.io/topic?id=28279
#anthropic #claudeopus #llmperformance #engineeringefficiency #reasoningtokens
