金のニワトリ (@gosrum)

gpt-5.4-mini의 ts-bench 벤치마크 결과를 공유함. 만점이 보편화되어 비교가 어려운 상황이지만, 적어도 gpt-5-mini(10위)보다 상당히 성능이 높아진 것이 분명하다고 보고. 어제 평가한 glm-5-turbo 결과도 함께 추가했음.

https://x.com/gosrum/status/2034060610913382606

#gpt5.4 #gpt #glm5turbo #benchmark #tsbench

金のニワトリ (@gosrum) on X

gpt-5.4-miniのts-bench評価結果を取り急ぎ共有 満点が当たり前になってきたので比較が難しいが、少なくともgpt-5-mini(#10)よりもかなり性能が高くなっていることは確か ※ついでに昨日評価したglm-5-turboも追加

X (formerly Twitter)