Epoch AI (@EpochAIResearch)
GPT-5.4가 FrontierMath(매우 도전적인 수학 벤치마크)에서 신기록을 세웠습니다. 사전평가 결과 GPT-5.4 Pro는 Tiers 1–3에서 50%, Tier 4에서 38%를 기록했고, 추가 실험과 해설은 스레드에서 확인할 수 있다고 알렸습니다.

Epoch AI (@EpochAIResearch) on X
GPT-5.4 set a new record on FrontierMath, our benchmark of extremely challenging math problems! We had pre-release access to evaluate the model. On Tiers 1–3, GPT-5.4 Pro scored 50%. On Tier 4 it scored 38%. See thread for commentary and additional experiments.