cedric (@cedric_chee)
작성자는 앞으로 테스트할 항목들을 나열했습니다: 게임 개발(gamedev), 비디오 이해 능력(비교 대상: Gemini 3 Pro/Flash), 대규모 복셀 렌더링, 핵심 추론(IMO 2025 문제 및 SimpleBench 퍼즐). 멀티모달, 그래픽스, 추론 성능을 다양한 벤치마크와 비교하려는 계획입니다.
cedric (@cedric_chee)
작성자는 앞으로 테스트할 항목들을 나열했습니다: 게임 개발(gamedev), 비디오 이해 능력(비교 대상: Gemini 3 Pro/Flash), 대규모 복셀 렌더링, 핵심 추론(IMO 2025 문제 및 SimpleBench 퍼즐). 멀티모달, 그래픽스, 추론 성능을 다양한 벤치마크와 비교하려는 계획입니다.