구글·엔비디아도 뛰어든 AI 신약개발···“바이오 데이터 활용 촉진법 제정해야”

이정민 기자 2024. 9. 29. 07:45
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

국회 '제약·바이오산업 AI 대전환 토론회'
AI 신약개발 추격 아닌 선도 국가 되려면
연합학습 기반 바이오데이터 활용 높여야
데이터 보호와 활용 동시에···합리적 보상
정부측, "범부처 빅데이터 구축통해 지원"
산학연, "비정형 데이터 활용도도 높여야"
국회 의원회관에서 26일 열린 '제약바이오산업의 AI 대전환 토론회'에서 참석자들이 기념촬영을 하고 있다. 사진 제공=최수진 의원실
[서울경제]

세계 각국이 인공지능(AI)을 활용한 신약개발에 뛰어들고 있는 가운데 국내에서도 바이오 데이터 활용을 높이기 위해 각종 지원이 필요하다는 목소리가 나왔다. AI 신약 개발 강국이 되기 위해 '바이오 데이터 활용 촉진법'을 제정해야 한다는 제안이 나왔다.

29일 업계에 따르면 최근 구글·엔비디아·페이스북 등 빅테크 기업들은 글로벌 제약사와 협력 사업을 추진하는 등 신약개발에 본격적으로 투자하고 있다. AI 신약개발 글로벌 시장 규모는 2022년 약 8000억 원으로 매년 45.7%씩 성장세를 보이고 있다. 2027년에는 약 5조 원 규모에 이를 것으로 예측된다. 신약개발에 AI를 활용하면 시간과 비용을 줄이고 임상 성공률을 획기적으로 높일 수 있다. 화이자도 AI를 활용해 코로나19 유행지역을 예측하고 임상시험에 활용하는 방식으로 mRNA백신 개발을 10.8개월로 단축했다.

현재 '추격자' 위치에 있는 국내 AI 신약개발을 가속화하기 위해 각종 지원이 필요하다는 목소리가 국회에서 나왔다. 최수진 국민의힘 의원이 26일 서울 여의도 국회에서 주최한 ‘제약바이오산업 AI대전환 토론회'에는 산업통상자원부·과학기술정보통신부·보건복지부 등 정부 관계자와 산·학·연 전문가들이 참석해 AI 신약개발을 위한 기술적·정책적 지원방안을 논의했다.

AI 신약개발에는 방대한 데이터 확보가 필수다. 국내에서 데이터 3법 개정으로 익명화된 개인정보를 연구에 활용할 수 있게 됐지만 신약개발을 위한 데이터 접근이 여전히 제한적이라는 지적이 있다.

이에 김화종 K-멜로디 사업단장은 '제약바이오 AI 강국을 위한 정책 제안' 발제를 통해 "공공 연구비가 투입된 사업의 데이터 활용을 의무화하고 국가 연구 데이터 및 바이오데이터를 공익화할 수 있도록 활용 촉진법을 제정해야 한다"고 말했다.

기존 바이오 데이터는 원천 데이터는 물론 가공된 데이터도 확보하기 어렵고 정보유출책임·품질관리 등의 문제가 있었다. 이 때문에 보건복지부와 과학기술정보통신부가 올해부터 연합학습 기반 신약 개발 가속화 프로젝트인 'K-멜로디 사업단'을 가동했다. 제약사 등 개별기관이 보유한 데이터를 AI에 학습시켜 결과물을 중앙 플랫폼에 집적하는 방식으로 김 단장에 따르면 데이터 원본이 아닌 파라미터(가중치)만 수집되므로 개인정보 유출 가능성이 없어 안전하다. 민감한 정보의 보호와 활용이 동시에 가능해진다. 실제로 엔비디아의 AI 의료 시스템 '클라라 FL', 유럽의 '오우킨(Owkin)' 등이 연합학습 시스템을 이용해 안전한 AI 의료 데이터 공유 및 활용 체계를 구축한 사례로 꼽힌다. 정부는 이 프로젝트에 2028년까지 5년간 348억원을 지원한다.

연합학습의 장점은 개인정보보호 외에도 데이터 제공자에게 합리적인 보상을 줄 수 있다는 점이다. 김 단장은 "기존에는 AI 학습 데이터를 제공받아도 해당 데이터가 모델 성능 개선에 어떤 기여를 했는지 정량적 판단이 어려워 데이터 가치 책정도 쉽지 않았다"며 "연합학습은 사용된 데이터가 모델 성능 개선에 얼마나 영향을 미쳤는지 기여도 측정이 가능한 구조이므로 합리적인 정산을 통한 데이터 공유 활성화를 촉진할 수 있다"고 강조했다.

김 단장은 “연합학습에서 공유되는 AI 모델은 개인정보보호법 또는 지적재산권 유출이 아니라는 법적 해석도 필요하며 개인정보보호법에 해당하지 않음을 명시해야 한다”며 “논문, 특허처럼 데이터 활용도를 연구평가에 반영해야 한다”고 제안했다.

강재우 아이젠사이언스 대표는 'LLM(초거대 언어모델) 시대 제약바이오산업 혁신방안' 발제를 통해 인재 확보의 중요성을 강조했다. 강 대표는 "기존 생물정보 대학원에 AI융합 스페셜트랙을 신설하는 등 전문인력 양성 대책이 마련돼야 한다"며 "양질의 문헌과 학습용 데이터를 무료로 활용할 수 있도록 신약개발 공공데이터셋을 구축하고 라이선스를 완화하는 제도가 필요하다"고 강조했다.

정부 측 토론자로 나선 김정대 산업통상자원부 바이오융합산업과장은 "산통부·과기부·복지부가 협력하는 범부처 바이오 빅데이터 구축사업을 통해 성능 좋은 AI 모델 개발을 지원할 계획"이라며 "내년부터 과기부와 진행하는 바이오 인프라 활용 구축 사업을 통해 제약바이오 생산 공정의 AI 전환도 지원하겠다"고 말했다.

남혁모 과학기술정보통신부 첨단바이오기술과장은 "AI바이오연구 협력 거점을 지정해 다양한 세부 분야 전문가의 아이디어를 집약하고 고성능 그래픽 처리장치(GPU)와 R&D 자금을 지원할 계획"이라며 "신약개발에 국한했던 AI기술을 정밀의료·바이오 제조·원료 생산까지 다양한 분야에 활용할 수 있도록 국회와 긴밀히 협력하겠다"고 말했다.

산·학·연 연구자들은 글로벌과 기술격차를 줄이기 위한 지원을 강조했다. 박래웅 아주대 교수는 "기존에 진단명 등 정형데이터를 데이터 모델로 구축하는 시도는 있었지만 비정형 데이터 표준화 사업은 미진하다"며 "생체신호·영상자료 등 비정형 데이터를 연구자가 활용할 수 있도록 해야 한다"고 말했다.

박수준 한국전자통신연구원(ETRI) 디지털융합연구소 본부장은 “연구자들이 연구보다 데이터 정리에 연구시간의 95%를 할애한다"며 "추격형이 아닌 선도형으로 가려면 국가가 하드웨어 도입과 활용을 대규모로 지원해야 한다"고 말했다.

이날 토론회에 참석한 최수진 의원은 "제약바이오 산업이 성과를 내기 위해서는 현실을 반영하지 못하는 오래된 법과 제도들의 개선이 필요하다"며 “바이오 챗GPT를 만들기 위해 AI 바이오 포럼도 만들 예정”이라고 말했다. 최 의원은 AI 신약개발 지원 등을 위해 'AI 디지털 바이오 육성법'을 추진하고 있으며 다음달 공개할 계획이다.

이정민 기자 mindmin@sedaily.com

Copyright © 서울경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?