‘영상 오류’ 찾는 인공지능 개발
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
오픈 AI 거대언어모델 인공지능이 엑스레이 사진 등 진단 영상에서 오류를 찾아내는 능력이 영상의학 전문의들과 비슷한 수준이면서도 시간·비용 효율성은 사람보다 훨씬 높다는 연구 결과가 나왔다.
GPT-4의 오류 감지율은 영상의학과 수석전문의 두 명을 제외하면 가장 높은 수준이며, 수석 전문의 중 한 명은 94.7%(150개 중 142개)의 오류 감지율을 보였다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
독일 쾰른대병원 영상의학과 로만 게르츠 박사팀은 2023년 6월부터 12월까지 한 병원에서 200건의 엑스레이·CT·MRI 영상을 수집하고, 이 중 100건에 누락·삽입·철자·방향 혼동·기타 등 다섯 개 범주의 오류 150개를 의도적으로 삽입했다. 이후 오픈 AI 거대언어모델 인공지능 GPT-4와 영상의학과 전문의 여섯 명(영상의학과 선임 전문의 두 명, 주치의 두 명, 레지던트 두 명)의 정확성과 속도, 비용 효율성 등을 비교했다.
연구 결과, GPT-4는 오류 150개 중 124개를 찾아낸 오류 감지율 82.7%를 기록했다. 사람 전문가의 오류 감지율은 각각 영상의학 선임 전문의가 89.3%(150개 중 134개), 주치의 80%(150개 중 120개), 레지던트 80%(150개 중 120개)로 나타났다. GPT-4의 오류 감지율은 영상의학과 수석전문의 두 명을 제외하면 가장 높은 수준이며, 수석 전문의 중 한 명은 94.7%(150개 중 142개)의 오류 감지율을 보였다. 이는 GPT-4와 영상의학 전문의 사이에 오류 감지율에 유의미한 차이가 없음을 의미한다.
GPT-4는 속도와 비용 효율성은 영상의학 전문의들보다 높은 것으로 나타났다. GPT-4의 진단 영상 한 건당 판독 시간은 평균 3.5초였으나, 이 연구에서 판독 속도가 가장 빠른 전문의의 판독 시간은 한 건당 평균 25.1초였다. 또한 GPT-4는 진단 영상 한 건당 평균 보정 비용이 0.03달러(한화 약 42원)로 비용 효율이 가장 높은 전문의(건당 0.42달러, 한화 약 582원)의 10분의 1 미만이었다.
연구 저자 로만 게르츠 박사는 “GPT-4를 활용해 영상의학 보고서의 정확성을 높여 환자 치료를 개선할 수 있다는 점에서 의미가 있다”고 말했다.
이 연구는 영상의학분야 저명 국제학술지인 ‘Radiology’에 최근 게재됐다.
Copyright © 헬스조선. 무단전재 및 재배포 금지.
- 두뇌 자극하려면 최소 ‘O분’은 걸어야
- 1형 당뇨병 성인 환자, ‘이 질환’ 위험 높다
- 잠든 상태에서 성행위, 다음날 되면 기억 사라져… 희귀 수면장애 '섹솜니아' 아세요?
- 발톱에 변화 없어도, 바로 아래 피부 ‘이런 변화’ 생기면… 무좀 생겼다는 신호
- 여성용 아내 화장품, 같이 써도 될까?… ‘이런 피부’라면 독 된다
- 밤이면 더 아픈 관절염, 오십견… ‘이렇게’ 자면 완화
- 손목터널증후군 vs 손목건초염, 나는 어디에 해당할까?
- 인천권역심뇌혈관질환센터, 보건복지부 ‘2024년도 우수 권역센터’로 선정
- 노원을지대병원 은병욱 교수, 보건복지부장관상 수상
- 중앙대병원 피부과 석준 교수, 한국보건산업진흥원 ‘글로벌 의사과학자 양성사업’ 선정