Sergio Paniego (@SergioPaniego)
LLM이 실제 물리와 비가역적 행동이 있는 환경에서 자동차를 운전하면 어떤 일이 벌어지는지 실험함. 작성자는 자율주행 시뮬레이터 CARLA를 OpenEnv로 포팅하고 TRL과 Hugging Face Spaces를 통해 학습 파이프라인을 구성했다. 결과적으로 Qwen 0.6B가 50스텝 만에 보행자를 피하기 위해 스티어링과 제동을 학습했다.

Sergio Paniego (@SergioPaniego) on X
What happens when you make an LLM drive a car where physics are real and actions can't be undone? I ported CARLA, the autonomous driving simulator, to OpenEnv and added training via TRL + HF Spaces In 50 steps, Qwen 0.6B learns to swerve and brake to avoid pedestrians