Ilir Aliu (@IlirAliu_)

Generalist가 GEN-1을 공개했으며, 같은 작업을 1,800회 연속으로 인간 개입 없이 수행한 장기 신뢰성 테스트에서 높은 안정성을 보였다. 다양한 작업에서 약 99% 성공률을 기록한 점이 핵심으로, AI 에이전트/모델의 실사용 신뢰성 향상을 보여주는 주목할 만한 결과다.

https://x.com/IlirAliu_/status/2039976446232531177

#ai #reliability #agent #generalist #model