HWE Bench: A new unbounded Benchmark for LLMs (GPT 5.5 is on top)
HWE Bench는 LLM이 설계한 RISC-V CPU 마이크로아키텍처를 FPGA에서 실제 성능으로 평가하는 무한 확장 벤치마크입니다. 기존 벤치마크와 달리 상한선이 없어 모델이 더 나은 설계를 찾을수록 점수가 계속 상승하며, GPT-5.5 모델이 인간 설계 기준인 VexRiscv를 크게 능가하는 성능을 기록했습니다. 이 벤치마크는 LLM의 하드웨어 설계 능력과 마이크로아키텍처 혁신을 실시간으로 추적할 수 있어 AI 하드웨어 엔지니어링 연구에 중요한 도구가 될 전망입니다.





