생성형AI의 의학·과학 습격...'전문가' 인간은 살아남을까

박건희 기자 2023. 7. 17. 08:06
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

인공지능은 단순한 이해를 넘어 창조의 영역까지 넘보고 있다. 위키미디어 제공

오픈AI의 챗GPT가 등장한 이후 글로벌 테크 공룡들이 앞다퉈 고성능 생성형AI(인공지능)를 내놓고 있다. 편향성, 허위정보를 의미하는 '환각' 등 생성형AI의 한계점도 드러나나면서 과학계에서는 AI가 과연 의학, 법학 등 전문 지식을 갖춘 인간의 전유물로 여겨졌던 분야를 대체할 수 있을 것인지에 대한 연구가 활발히 이뤄지고 있다.

경제협력개발기구(OECD)는 지난 11일 "일자리의 27%는 AI에 의해 대체될 것"이라며 "특히 의학, 법률, 경영 등 전문직군의 실업률이 높아질 것"이라고 경고하기도 했다. 과학자들은 AI가 신약 개발, 헬스케어 등 사회 필수 분야에 활발히 활용되면서 도움이 될 것으로 보는 동시에 인간을 대체하기엔 아직 한계가 있다는 내용을 담은 연구결과를 속속 내놓고 있다. 

● 외과 수술부터 항감염제 개발, 심리 치료까지…의료계 전반에서 활용되는 AI

국제학술지 '사이언스'는 14일(현지시간) '기계 지능 세계(A Machine-Intelligent World)'라는 제목의 '특집(스페셜 이슈)'을 통해 최신 AI기술 전반을 조망하는 9편의 논문을 무더기로 공개했다. 이 중 일부는 의료계 전반에서의 AI 활용이 긍정적인 영향을 주고 있다는 분석을 담고 있다.

대표적인 게 셉티뮤 살쿠딘 캐나다 브리티시컬럼비아대 교수와 미셸 윕 미국 샌디에이고캘리포니아대(UC샌디에이고) 기계컴퓨터공학 박사가 발표한 'AI와 의료용 로봇의 만남' 논평이다.이들은 "질병 진단, 재활 치료, 수술 등 전반적인 의료 분야에서 AI를 활용할 수 있다"라고 말했다. 예컨대 수술용 AI로봇은 집도의가 손떨림으로 인한 조직 손상없이 복잡한 수술 과정을 마칠 수 있게끔 원격 기기 조정을 통해 도와준다는 것이다. 의료 AI를 도입하면 더 안전하고 효율적인 치료가 가능해진다는 설명이다. 

항감염제 등 약물 개발에도 활용할 수 있다. 제임스 콜 매사추세츠공대(MIT) 의공학과 교수, 펠릭스 옹 미국 브로드연구소 박사 등이 주도한 연구진은 '전염병 대항전에서의 인공지능 활용'이라는 제목의 사이언스 리뷰을 통해 "AI의 기계학습 알고리즘을 활용하면 병원성 박테리아를 사멸할 항생제를 개발할 수 있다"라고 밝혔다. AI가 방대한 데이터를 분석해 저분자, 단백질 등의 구조를 파악한 뒤 이를 모델링하면 그 정보를 약물 개발에 활용할 수 있다는 것이다.   

AI가 심리 치료에 도움이 된다는 분석도 나온다. 미국 듀크대 연구팀은 "설문조사에 참여한 유럽·북미 심리학자 307명 중 69%가 AI가 인간의 고립감을 해소해주며 친구가 되어줄 수 있다는 데 동의했다"는 연구결과를 12일 학술지 '사이언스 로보틱스'에 공개했다. 

● 과학자들, AI 성능 뛰어나지만… "인간만이 가진 능력 여전히 필요" 

일각에서는 AI 성능이 뛰어나지면 인간만이 지닌 능력에는 아직 못미치기 때문에 인간의 능력이 여전히 필요하다는 연구결과도 나오고 있다. 카란 싱갈, 세쿠페 아지지, 타오 투 등 구글 소속 연구진은 지난 4월부터 차세대 거대언어모델(LLM)인 '팜2(PaLM2)'를 적용한 의료용 AI '메드-팜2(Med-PalM2)'의 성능을 테스트한 결과를 지난 11일(현지시간) 학술지 '네이처'에 논문으로 공개했다. 메드-팜2는 챗봇 형태의 AI로, 환자가 자신의 상태를 챗봇에 입력하면 입력된 문장을 분석해 병명을 진단하고 의학적 소견을 내놓는다.

연구진은 테스트를 위해 '멀티메드QA(MultiMedQA)'라는 데이터 세트를 제작했다. 실제 미국 의사면허시험에 출제되는 의학 지식·연구관련 문항과 유사한 문항 6개에 인터넷에서 검색을 통해 찾을 수 있는 의학관련 질문 3173개를 결합한 데이터다. 정확한 평가를 위해 AI가 내놓은 답변의 이해력, 추론력, 편향성 등은 사람이 직접 점수를 매기도록 했다.

그 결과 메드-팜2은 구글이 작년에 개발한 1세대 모델 AI에 비해 17% 더 높은 정답률을 보였다. 하지만 다지선다형 문제에는 강했지만, 장문형 답을 쓰는 능력은 부족한 것으로 판단됐다. AI의 정답률은 인간 임상의보다 전체적으로 낮았다.

매튜 드캠프 미국 콜로라도약대 부교수는 14일(현지시간) 사이언스에 발표한 논평 '보건 영역에서의 AI 편견 완화'를 통해 "AI가 의료계나 공중보건 영역에서 성공할지는 미지수"라고 밝혔다. 그는 "AI는 환자의 인종, 성별 등에 따른 변수를 의학적 지식만으로는 판단할 수 없다"며 "이는 학습 데이터 자체가 편향성을 띠고 있을 수 있기 때문"이라고 지적했다. 

[박건희 기자 wissen@donga.com]

Copyright © 동아사이언스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?