Wes Roth (@WesRoth)
Minimax M2.7이 인간 개입 없이 100회 이상 스스로 진화한 방식이 매우 이례적으로 소개됐다. 초기 버전의 같은 모델로 연구 에이전트를 만들어 RL 팀 업무의 30~50%를 처리하게 했고, 이후 예상 밖의 수준으로 발전했다는 점이 핵심이다. 자율적 모델 개선과 연구 자동화 사례로 주목된다.

Wes Roth (@WesRoth) on X
how Minimax M2.7 was made is absolutely INSANE it "evolved" 100+ times with zero human input They built a research agent using an early version of that same model soon it was handling 30 to 50 percent of their RL team's entire workflow. and then it got WEIRD



