Mastodawn

Cosine, 새로운 AI 코딩 도구 'Genie' 발표

https://www.clien.net/service/board/news/18782930?od=T31&po=0&category=0&groupCd=

Cosine, 새로운 AI 코딩 도구 'Genie' 발표. 기존 모델 성능 상회 : 클리앙

인공지능(AI) 기반 소프트웨어 엔지니어링 분야에서 새로운 발전이 있었습니다. Y Combinator 스타트업 액셀러레이터를 통해 설립된 Cosine이라는 회사가 Genie라는 AI 기반 자율 엔지니어를 발표했습니다. Genie는 이전에 주목을 받았던 Cognition의 Devin을 능가하는 성능을 보여주고 있습니다. (다른 AI 코딩 엔지니어 모델과 비교한 SWE-Bench. 출처: Cosine) Genie는 제3자 벤치마크 테스트인 SWE-Bench에서 30%의 점수를 얻었습니다. 이는 Devin의 13.8%와 Amazon의 Q, Factory의 Code Droid가 얻은 19%를 크게 앞서는 결과입니다. Cosine의 CEO인 Alistair Pullen은 Genie가 단순한 벤치마크 점수 이상이며, 인간 소프트웨어 엔지니어처럼 생각하고 행동하도록 훈련되었다고 설명했습니다. Genie는 버그 수정, 기능 구축, 코드 리팩토링, 종합적인 테스트를 통한 코드 검증 등 다양한 코딩 작업을 자율적으로 처리할 수 있습니다. 이 AI는 완전히 자율적으로 작동하거나 사용자와 협력하여 작업할 수 있으며, 숙련된 동료와 함께 일하는 경험을 제공하는 것을 목표로 합니다. Genie는 JavaScript, Python, TypeScript, Java, C#, C++, Rust 등 15개 이상의 프로그래밍 언어로 소프트웨어를 작성할 수 있습니다. Genie가 생성한 코드는 사용자의 GitHub 저장소에 저장되며, Cosine은 이 코드의 복사본을 보관하지 않아 보안 위험을 최소화했습니다. Genie의 개발에는 OpenAI의 긴 토큰 출력 AI 모델이 사용되었습니다. 이 모델은 GPT-4o의 변형으로, 최대 64,000 토큰의 출력을 생성할 수 있어 이전 모델보다 16배 더 긴 출력이 가능합니다. Cosine은 Genie를 훈련시키기 위해 거의 1년 동안 실제 엔지니어들의 소프트웨어 개발 활동을 포함하는 데이터셋을 구축했습니다. 이 데이터셋은 인간 엔지니어의 의사결정 과정을 포착하고 있어, Genie가 인간처럼 문제를 해결할 수 있도록 합니다. Genie의 가격은 두 가지 등급으로 나뉩니다. 하나는 약 20달러 선의 접근 가능한 옵션으로, 개인과 소규모 팀을 위한 것입니다. 다른 하나는 엔터프라이즈 수준의 제품으로, 확장된 기능과 무제한에 가까운 사용이 가능하며 가격은 더 높게 책정될 예정입니다.