DeepReinforce (@deep_reinforce)
CUDA-L1의 결과는 iterX와 무료 토큰을 사용하면 쉽게 재현할 수 있다는 안내입니다. 실험 재현성과 접근성을 높여주는 도구(또는 워크플로우) 소개로, 연구 결과 검증 및 실습에 유용한 정보입니다.
DeepReinforce (@deep_reinforce)
CUDA-L1의 결과는 iterX와 무료 토큰을 사용하면 쉽게 재현할 수 있다는 안내입니다. 실험 재현성과 접근성을 높여주는 도구(또는 워크플로우) 소개로, 연구 결과 검증 및 실습에 유용한 정보입니다.
DeepReinforce (@deep_reinforce)
CUDA-L1이 ICLR 2026에 채택되었다는 발표입니다. 본 연구는 CUDA 코드 생성에 강화학습(RL)을 처음 적용한 작업이며, 이후 CUDA-L2 등 후속 작업도 함께 언급했습니다. 연구 커뮤니티의 빠른 발전을 강조하며 추가 결과와 업데이트는 추후 공개될 예정이라는 내용입니다.
https://x.com/deep_reinforce/status/2015894636448149665
#cudal1 #cuda #reinforcementlearning #iclr2026 #codegeneration

🎉🎉CUDA-L1 is accepted to ICLR 2026! 🌟🌟This was our first work using RL for CUDA generation. Now we have CUDA-L2, alongside so much great work from the community. It’s amazing how fast the field has moved in just the past six months. 🦾🦾 Still cooking! stay tuned! 🔗Paper