Building low-latency voice agents in 3 lines of code with GPT Realtime 2 and AG2
OpenAI가 GPT Realtime 2를 활용한 저지연 음성 에이전트 구축을 위한 LiveAgent를 공개했다. LiveAgent는 단일 양방향 세션에서 연속 오디오 입출력과 음성 활동 감지를 지원해 전화 통화처럼 자연스러운 대화 흐름과 즉각적인 끼어들기를 가능하게 한다. 3줄 코드로 간단히 구현할 수 있으며, 도구 호출과 서브에이전트 위임도 실시간 음성 세션 내에서 지원해 복잡한 작업도 처리할 수 있다. OpenAI와 Gemini 모델을 지원하며, 기존 STT-에이전트-TTS 방식 대비 낮은 지연과 자연스러운 대화 경험을 제공한다.






