ModelScope (@ModelScope2022)
StepFun의 음성 모델 'Step-Audio-R1.1'이 Artificial Analysis Speech Reasoning 리더보드에서 SOTA를 달성했습니다(정확도 96.4%). Grok, Gemini, GPT-Realtime 등을 능가했으며 네이티브 오디오 추론(End-to-End), 오디오-네이티브 CoT, 실시간 처리를 특징으로 합니다.

ModelScope (@ModelScope2022) on X
Step-Audio-R1.1 by @StepFun_ai just set a new SOTA on the Artificial Analysis Speech Reasoning leaderboard! 🏆 It outperforms Grok, Gemini, and GPT-Realtime with a 96.4% accuracy rate. ✅ Native Audio Reasoning (End-to-End) ✅ Audio-native CoT (Chain of Thought) ✅ Real-time