자율車·이동로봇 영상데이터 원본 활용…네이버·우아한형제들(종합)

송혜리 기자 2023. 11. 15. 11:43
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

자율차, 이동형 로봇 기업 영상데이터 원본 활용 실증 특례
뉴빌리티·우아한형제들·네이버랩스 등 신청 완료
의료 데이터 활용 강화…AI 저작권 가이드라인 연내 발표
[서울=뉴시스] 김명원 기자 = 고학수 개인정보보호위원회(개인정보위) 위원장이 14일 서울 종로구 정부서울청사에서 제1차 범정부 마이데이터 협의회에 참석해 인사말을 하고 있다. 2023.11.14. kmx1105@newsis.com


[서울=뉴시스]송혜리 기자 = 정부가 규제샌드박스 제도를 통해 자율주행차·이동형 로봇 서비스 고도화를 위한 영상데이터 원본 활용을 허용키로 한 가운데, 네이버(네이버랩스)·우아한형제들(배달의민족), 뉴빌리티 등 9개 기업이 첫번째 실증특례 수혜기업이 될 예정이다. 이어 현대자동차와 카카오(카카오모빌리티)도 실증특례 신청을 준비 중인데, 정부는 '패스트트랙'을 통해 신속 검토를 해 줄 방침이다.

정부는 15일 정부서울청사에서 열린 '데이터 경제 활성화 추진과제' 브리핑을 통해 이같이 설명했다. '데이터 경제 활성화 추진과제'는 이날 오전 정부서울청사에서 열린 비상경제장관회의에서 공개됐다.

정부는 이번 발표를 통해 ▲자율주행·로봇분야 영상정보 원본 활용 허용 ▲공적 데이터 개방 확대·AI 학습데이터 시장 활성화 ▲보건·의료 데이터 활용 범위 개선 ▲마이데이터 선도 서비스 추진 등을 추진하겠다고 제시했다. 생성형 인공지능(AI) 등장, 자율주행 기술 고도화 등 신산업 발전이 가속화되고 있는 상황에서 데이터 산업 생태계 구축을 통한 데이터 경제 활성화가 시급하단 판단이다.

우아한형제들·네이버랩스 실증특혜 신청…"전면 활용·제도 개선은 향후 문제"

양청삼 개인정보보호위원회 정책국장은 "자율주행·로봇 분야의 기술혁신을 지원하겠다"면서 "규제샌드박스 실증특례를 통해 안전성 확보조치를 전제로 영상데이터 원본 활용을 허용하겠다"고 말했다.

자율주행·로봇 분야에서 영상데이터 원본은 현행 과학적 연구, 통계 목적 등으로 활용할 경우 정보주체의 동의없이 활용할 수 있도록 하고 있다. 아울러 개인을 구분할 수 없도록 가명 처리(마스킹·블러링)를 한다면 AI 연구 목적으로 활용할 수 있다. 정부는 이번 규제샌드박스 실증특례를 허용하면서 일정한 안전조치가 보장된다면 영상데이터 원본을 가명처리 없이 활용할 수 있도록 허용해 줄 방침이다.

양청삼 국장은 "예를 들어 자율주행 자동차 개발과 서비스 로봇 기업들이 영상데이터를 안전하게 처리할 수 있는 조건을 만족한다면, 영상데이터 원본을 가명 처리없이 활용할 수 있도록 하자는 것"이라며 "그러나 사용조건이 자율주행 알고리즘 개선을 위한 목적으로만 활용하도록 할 것"이라고 밝혔다.

다만, 자율주행·로봇 분야에서 영상 원본데이터를 전면 활용할 수 있도록 하는 제도 개선까지는 현재 고려하고 있지 않다고 선을 그었다.

양청삼 국장은 "실증특례를 했다고 해서 무조건 제도 개선으로 연결되는 것은 아니다"라며 "실증 특례를 통해서 사업자가 신기술을 새롭게 실험을 해보고 그다음에 검증을 해보려는 그런 목적이 있으며, 정부 당국은 현재 현행 제도가 불합리라든지 모호하거나 그리고 개선할 사항이 없는지 그에 입각한 어떤 제도 개선을 위한 어떤 근거들을 실제 승계를 통해서 확보해 나간다는 두 가지 취지가 있다"고 말했다.

MRI·CI 합성데이터 13.5만장 의료AI 학습용으로 제공

정부는 보건·의료 데이터 활용도 높일 방침이다.

개인정보가 제거된 MRI, CT, 엑스레이(X-ray) 합성데이터 13만5000장을 기업에 제공해 의료 AI발전을 지원한다. 이는 정부에서 의료 합성데이터를 생성해 제공하는 최초 사례다. 합성데이터는 원본데이터와 통계적 특성은 유지하되, 개인을 구분할 수 있는 정보를 제거해 재생성한 데이터를 말한다.

유전자 데이터 활용 제고를 위해 '소비자 대상 직접 시행(DTC)' 유전자 검사 허용범위를 기존 웰니스 항목에서 질병 유사 항목까지 확대하고, 유전체 데이터에 대한 가명처리 기준도 구체화한다. DTC는 의료기관을 방문하지 않고 소비자가 직접 타액 샘플을 채취해 유전자 검사업체에 검사를 신청하고 결과를 받아볼 수 있는 서비스를 말한다.

아울러 건강보험 가명데이터를 적극 개방해 건보공단-민간 보험사 등이 고혈압·당뇨 환자의 건강증진 요인 분석 등 다양한 공동연구를 추진할 수 있도록 한다.

오는 2025년 마이데이터 본격 시행에 앞서 의료분야를 선도 서비스로 지목했다. 의료 마이데이터는 '투트랙(Two-track)'으로 추진해 의료기관 간 진료정보는 중복검사 등 국민 불편이 없도록 보다 많은 데이터가 전송되는 체계를 만들고, 의료기관 바깥에서의 산업·연구 목적 활용과 관련해서는 '선도·실증 프로젝트' 등을 통해 부작용이 없도록 단계적으로 확대할 방침이다.

심은혜 보건복지부 보건의료데이터진흥과장은 "의료 마이데이터 관련해 시행 초기이기 때문에 봇물터지듯이 움직이진 않을 거라고 생각한다"면서 "그럼에도 불구하고 저희가 소비자연맹을 통해서 수요조사를 해본 결과, 국민들의 한 86% 이상이 '의료데이터의 활용이 필요하다', '건강관리 서비스를 하고 싶다' 그리고 '의료기관 전원할 때 그런 정보들을 활용하고 싶다'라는 욕구들이 파악됐다"고 설명했다.

한편, 정부는 생성형 AI 시대를 맞아 저작권 제도도 정비한다. AI 학습데이터 활용 시 정당한 대가 지급 등 저작물 이용 지침을 안내하는 'AI-저작권 가이드라인'을 연내 마련한다.

강규호 문체부 저작권국 사무관은 "저작물에 대해서는 AI 학습데이터로 이용할 시 정당한 대가를 지급해야 된다는 방향으로 현재 검토하고 있으며 12월 초에 관련 가이드라인을 공식 발표할 예정"이라고 밝혔다.

☞공감언론 뉴시스 chewoo@newsis.com

Copyright © 뉴시스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?