Can AI Chatbots Reason Like Doctors?
OpenAI의 대형 언어 모델(LLM)이 실제 응급실 기록을 활용한 임상 추론 과제에서 의사들을 능가하는 성과를 보였다는 연구가 Science에 발표되었다. 그러나 의료용 챗봇의 신뢰성 문제, 평가 기준의 부재, 그리고 환각 현상 등 한계도 지적되고 있다. 의료 현장에서 LLM을 보조 도구로 활용하는 방안에 대한 연구와 임상 시험이 필요하며, AI와 의사의 협업 방식을 모색하는 것이 중요하다는 의견이 제시된다. 현재 의료용 AI는 빠르게 발전 중이나 규제와 책임 문제는 여전히 해결 과제로 남아 있다.




