GPT-4, 한의사 국가시험 정답률 66%…합격선 넘겨

백진호 2023. 12. 22. 17:16
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

  국내 연구진이 생성형 인공지능(AI) 챗봇 모델 GPT-4가 한의사 국가시험에 합격할 수준을 갖췄다고 밝혔다.

김창업 가천대학교 한의과대학 교수 연구팀은 22일 GPT-4가 한의사 국가시험을 통과할 수 있는 수준의 성능을 보였다고 발표했다.

연구팀은 GPT-4 모델을 한의학 관련 AI 개발에 적용할 수 있을지 평가하기 위해 연구를 진행했다.

이전 연구에서 GPT-4는 2022년에 시행된 한의사 국가시험을 치렀는데, 평균 57.59%의 정답률을 기록했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

이전 연구선 정답률 57% 기록
합격선 60%에 미치지 못한 결과
이번 연구선 정답률 66% 도달
‘프롬프트 엔지니어링’ 활용이 요인
한의학적 특수성 반영 위한 노력 필요
김창업 가천대학교 한의과대학 교수. 가천대학교 제공
 
국내 연구진이 생성형 인공지능(AI) 챗봇 모델 GPT-4가 한의사 국가시험에 합격할 수준을 갖췄다고 밝혔다.

김창업 가천대학교 한의과대학 교수 연구팀은 22일 GPT-4가 한의사 국가시험을 통과할 수 있는 수준의 성능을 보였다고 발표했다.

연구팀은 GPT-4 모델을 한의학 관련 AI 개발에 적용할 수 있을지 평가하기 위해 연구를 진행했다.

이전 연구에서 GPT-4는 2022년에 시행된 한의사 국가시험을 치렀는데, 평균 57.59%의 정답률을 기록했다.

이는 합격선(60% 이상)에 미치지 못하는 결과다.

이번 연구에서는 GPT-4의 언어 모델에 문항을 제시하는 방식을 최적화해 성능을 극대화하는 ‘프롬프트 엔지니어링’ 기법을 활용했다.

그 결과, GPT-4는 합격선을 웃도는 정답률을 보였다.

2022년도 한의사 국가시험 문제를 GPT-4에 제시한 후 정답률을 평가했는데, GPT-4는 340문항 중 225문항(정답률 66.18%)을 맞혔다.

과목별 정답률은 과락 기준인 40%보다 높았다.

GPT-4는 국제적으로 표준화된 진단 기준에 대한 문제가 많은 본초학, 소아과학, 부인과학 과목에서 각각 81.2%, 81.2%, 79.2%의 정답률을 기록했다.

반면 한국 한의학의 특성을 반영하는 보건의약관계법규, 사상의학 과목에서는 각각 40%, 43.8%의 상대적으로 낮은 정답률을 보였다.

연구팀은 이와 관련해 “한국어로 이뤄진 문항을 언어 모델에 그대로 입력했을 때는 평균 정답률이 51.82%였다”고 말했다.

또 “한의학 용어를 한자로 함께 적었을 때는 57.59%, 지시와 문제를 영어로 스스로 번역하게 한 후 해당 문제를 풀게 할 때는 63.65%로 상승해 정답률이 높아지는 것을 확인했다”고 설명했다.

아울러 “이번 연구에서 GPT-4는 한국의 특수성을 잘 받아들이지 못할 수 있음을 보여줬다”고 밝혔다.

이어 “추후 의료 AI 모델을 개발할 때 각 국가와 지역의 특수성을 반영하는 노력이 필요할 것”이라고 강조했다.

한편 해당 연구 결과는 온라인 과학 저널인 ‘플로스 디지털 헬스’(PLOS Digital Health)에 실렸다.

백진호 온라인 뉴스 기자 kpio99@segye.com

Copyright © 세계일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?