LLM Stats (@LlmStats)
Step-3.5-Flash(또는 StepFun의 모델)가 LiveCodeBench V6에서 0.864로 1위를 기록하며 Kimi K2.5(0.85), GLM-4.7(0.849), GPT OSS 120B(0.819) 등을 제치고 최상위 성능을 보였습니다. LiveCodeBench V6는 실제 경쟁 프로그래밍 플랫폼의 최신 문제로 모델을 평가하는 벤치마크입니다.

LLM Stats (@LlmStats) on X
Step-3.5-Flash (@StepFun_ai) tops LiveCodeBench V6 with 0.864 #1 out of all models, ahead of Kimi K2.5 (0.85), GLM-4.7 (0.849), and GPT OSS 120B (0.819). LiveCodeBench V6 tests models on fresh, real-world coding problems from competitive programming platforms. Step-3.5-Flash
