[AWS 리인벤트 2022] “의료데이터 민주화로 암 정복에 한발짝 더 다가가”

김대은 기자(dan@mk.co.kr) 2022. 12. 6. 16:12
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

타하 카스호우트 AWS 의료산업분야 총괄이 1일(현지시간) 미국 라스베이거스 내 리인벤트(re:Invent) 행사장에서 진행된 매일경제와의 인터뷰에서 진지한 표정을 짓고 있다.
“AWS의 헬스케어 서비스를 사용하면 대규모의 의료 데이터를 최저 비용으로 저장·분석할 수 있습니다. 클라우드상에서 진행되기 때문에 별도로 인프라를 관리하거나 최적화하지 않아도 됩니다.”

타하 카스호우트 AWS 의료산업분야 총괄은 지난 1일(현지시간) 미국 라스베이거스 내 리인벤트(re:Invent) 행사장에서 진행된 매일경제와의 인터뷰에서 이처럼 밝혔다.

카스호우트 총괄은 하버드 의대를 졸업한 의사 출신이다. 미국 식품의약청(FDA) 등에서 근무하다 지난 2017년부터 AWS로 옮겨 의료산업 분야를 이끌고 있다.

그는 AWS가 최근 발표한 ‘아마존 헬스레이크 오믹스’ 기능을 소개했다. 이는 의료 분야 연구자가 관련 정보를 저장하고 분석하는 데에 활용하는 서비스다. 카스호우트 총괄에 따르면 아마존 헬스레이크 오믹스는 ①데이터를 인지해서 최저 비용으로 저장하고 ②저장한 데이터에서 의미를 추출한 뒤 ③추출한 의미를 분석해 각종 통찰을 끌어낼 수 있다.

AWS는 이미 재작년 ‘아마존 헬스레이크’를 발표하면서 정형·비정형 데이터를 페타바이트(PB) 규모로 저장하고 분석할 수 있게 했다. 최근에는 ‘아마존 헬스레이크 이미징’을 발표해 의학 관련 영상 자료도 이와 같은 규모로 분석할 수 있게 됐다. 카스하우트 총괄은 “전세게적으로 연간 55억 건의 의료 영상이 생성되고 있다”며 “최근 한 고객사는 이 서비스를 통해 의료 영상 처리 비용을 40%가량 절감했다고 한다”고 말했다.

여느 분야와 마찬가지로 헬스케어 분야에서도 디지털화가 진행됐다. 카스호우트 총괄은 “10년 전에는 의무기록의 10%가량만 디지털로 이뤄졌지만, 이제는 병원 외래기록부터 원격의료 관련 자료에 이르기까지 거의 모든 의무기록이 디지털로 기록되고 있다”고 말했다. 또한 그는 “스마트워치 등 의료용 웨어러블 기기가 보급되고 최근 코로나19 국면에서 예방접종 관련 기록을 처리하는 것도 모두 디지털로 처리된다”고 덧붙였다.

그런데도 이처럼 방대해진 양의 디지털 의료정보를 처리하는 데에 필요한 역량은 역부족이었다는 게 카스하우트 총괄의 진단이다. 그는 “의료 데이터는 굉장히 복잡하기 때문에 많은 고객이 이를 처리하는 데에 어려움을 겪고 있다”며 “비정형 데이터의 97%가 사용되지 못하고 사라진다는 분석도 나왔다”고 말했다.

카스호우트 총괄은 헬스케어 분야의 특성상 환자의 민감한 개인정보를 보호하기 위해 다양한 노력을 기울이고 있다는 점을 특히 강조했다. 그는 “AWS에서는 (데이터 처리를 위한) 기술만 제공할 뿐 그 안에 있는 데이터를 직접 열람하지는 않는다”며 “미국 의료정보보호법(HIPAA)·유럽 일반개인정보보호법(GDPR) 등 전세계적으로 요구되는 개인정보 관련 규제 사항을 성실히 준수하고 있다”고 말했다. 수동적으로 규제를 준수하는 것을 넘어 적극적으로 개인정보 보호를 위한 기능을 탑재했다는 점도 특징이다. 카스호우트 총괄은 “아마존 헬스레이크 이미징과 아마존 헬스레이크 애널리틱스에는 의무기록 등 관련 데이터에서 자동으로 개개인을 식별할 수 있는 부분을 삭제하는 기능이 탑재돼 있다”고 설명했다.

방대한 양의 데이터를 처리할 때 따르는 ‘표준화’ 문제에 대해서도 AWS가 해결책을 제시할 수 있다고 카스호우트 총괄은 강조했다. 현재 국내에서는 전자의무기록(EMR) 데이터에 대한 표준 규약이 정립돼있지 않아 서로 다른 규격으로 만들어진 데이터를 한꺼번에 저장하고 처리하는 데에 어려움을 겪는 경우가 많다. 이에 대해 카스호우트 총괄은 “AWS가 직접적으로 EMR 솔루션을 제공하는 것은 아니다”면서도 “자사의 헬스레이크 애널리틱스 서비스를 활용하면 각기 다른 곳에서 가져온 데이터를 고속헬스케어상호운용자원(FHIR) 기준으로 변환해 저장하거나 분석할 수 있다”고 말했다.

실제로 국내외의 많은 보건의료분야 업체에서 AWS의 클라우드 기술을 이용하고 있다.

삼성서울병원은 AWS를 활용해 세계 최초로 미국 보건의료정보관리시스템협회(HIMSS)의 IT 인프라 인증(INFRAM) 7단계를 받았다. 최고 등급인 7단계에서는 모빌리티, 보안, 협업, 전송, 데이터센터 등 의료 기관이 갖춰야 할 핵심 영역 5가지의 성숙도를 평가한다. 삼성서울병원의 데이터 플랫폼은 AWS 클라우드 기술을 활용해 임상 연구를 지원하며 글로벌 임상 연구 클라우드 플랫폼인 DARWIN(Data Analytics and Research Window for Integrated Knowledge)을 도입해 데이터를 안전하게 연계하고 연구에 활용하고 있다. DARWIN을 사용하는 전 세계의 의학 연구자들은 안전한 방식으로 치료 요법 및 진단 참조 등 환자 데이터를 안전하게 공유할 수 있으며, 안전한 환경에서 협업하며 질병에 대한 이해도를 높일 수 있다.

AWS 스타트업 램프 고객인 카이헬스(Kai Health)는 AI를 활용해 난임 치료 전문병원이 더 나은 치료 결정을 내릴 수 있도록 지원한다. 특히 AWS에 백엔드 시스템을 구축하고, AWS 코드커밋(AWS CodeCommit)을 이용해 AI 소스를 관리하고 있다. 아마존 세이지메이커(Amazon SageMaker)를 활용한 딥러닝 환경에서는 AI 임상 결정 지원 시스템을 활용해 디지털로 저장된 의료 기록 및 영상 기반의 배아 분석 정확도를 높이고, 분석 시간을 단축해 난임 시술의 성공률을 높였다.

클라우드 전문 기업이나 AWS 파트너인 메가존(Megazone)은 스타트업 메디컬아이피(Medical IP)와 협력하여 전 세계 의사들이 코로나19를 더 손쉽게 진단할 수 있도록 AI 솔루션을 개발하도록 돕고 있다. 특히 메디컬아이피는 서울대학교병원이 설립한 헬스케어 스타트업으로 AWS를 활용해 코로나19 감염 환자의 X-레이 이미지로 코로나19 중증도를 판독하는 AI 소프트웨어 티셉 코비드19(TiSepX COVID-19)를 개발했으며, 티셉 코비드19는 AWS 서비스를 활용해 X-레이 이미지를 처리하고 AI 훈련 시간을 기존 1개월에서 1주로 단축했다. 환자들이 팬데믹으로 인한 불확실성을 크게 체감하고 있는 상황에서 만든 의미 있는 성과였다. 티셉은 결핵과 같은 다른 질병을 진단하고 폐 병변을 분석하는 데에도 사용된다.

서울대학교병원은 반세기 가까이 국가중앙병원으로서 임상과 연구분야를 선진화하고, 국제적 경쟁력을 강화하는 등 대한민국 의료의 표준과 혁신을 이끌어 왔다. 서울대학교병원에서 진행하는 의료연구에서는 AWS 클라우드를 100% 활용한다. 전국 의료기관 중 가장 많은 의료 데이터를 보유한 곳으로 꼽히는 서울대학교병원은 누적 데이터만 1.8 PB가 넘는다.

서울대학교병원은 AWS 파트너인 클라우드 전문기업 메가존과 함께 클라우드 기반 빅데이터 연구 플랫폼 ‘SUPERB’(SNUH Utility for Practice, Education and Research using Big-data)를 구축했다. 의료데이터를 활용한 연구활동 중 저장, 운용과정에서 어려움을 겪었던 확장성과 데이터 유출에 대한 위험요소를 원천적으로 차단하고, 데이터에 대한 승인 및 엄격한 심사 절차 또한 클라우드 기반의 자격권한관리(AWS IAM: Identity & Access Management), Amazon EC2, Amazon CES, Amazon S3, Amazon RDS, Amazon Athena; AWS Glue, AWS Lake Formation, Amazon API Gateway, AWS CodeCommit 기능과 같이 클라우드 장점을 적극 활용해, 긴밀한 의료연구가 가능하게 됐다. 그뿐만 아니라 다양한 의료데이터의 연계 및 통합 플랫폼의 구축으로 외부기관과의 공동연구가 가능해지고, 연구활동에 필요한 컴퓨팅자원(IT인프라)에 대한 중복 투자 및 연구기자재 구매단계를 제거해, 즉시 연구를 통해 비용절감과 전체 기간 단축을 할 수 있게 됐다.

서울대학교병원은 코로나19 팬데믹 중 AWS를 활용해 환자 진단 영상 데이터를 중앙모니터링센터에 중앙 집중식으로 저장했다. 이를 통해 의료진은 환자의 상태를 면밀히 모니터링하고 의료 결정을 내릴 수 있었다. 이 덕분에 경증 및 무증상 코로나19 환자의 경우 대구·경북의 다른 지역 병원으로 환자를 이송해 추가 치료를 받거나, 첨단정보시스템을 갖춘 문경생활치료센터에 격리하는 등 적절한 조치를 취할 수 있었다. 서울대학교병원은 Amazon S3 및 AWS IAM을 활용해 중요 시스템을 구축하는 데 걸리는 시간을 2개월에서 단 2일로 단축하여 환자의 영상 데이터를 CD 또는 DVD로 전송할 필요 없이, 클라우드 기술을 활용해 환자 진료 과정을 개선했다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?