[AI 서비스 PM, 이제 '기획'을 넘어 '평가'를 설계하라
이 글은 생성형 AI 서비스가 늘어나면서 PM의 역할이 단순한 기획을 넘어, 무엇이 좋은 AI 결과인지 ‘평가 기준’을 설계하고 품질을 책임지는 방향으로 바뀌고 있다고 설명한다. 전통적인 소프트웨어처럼 명확한 정답을 검증하는 QA 방식과 달리, AI 서비스는 주관적이고 연속적인 품질 스펙트럼을 다뤄야 하므로 PM이 평가 기준을 명문화하고 데이터셋을 만들며, 필요시 LLM Judge를 활용해 자동 평가 체계를 구축해야 한다는 점을 강조한다.
