가명처리 불완전해도 제재 안 해…개인정보위, AI 기업 데이터 활용 문턱 낮춘다

정부서울청사의 개인정보보호위원회 /사진=이진솔 기자

정부가 인공지능(AI) 기업들의 학습용 데이터 확보를 위해 가명정보 제도를 전면 개편한다. 개인정보보호위원회는 불완전한 가명 처리도 제재하지 않는 등 파격적인 방침을 담아 활용도를 획기적으로 개선할 계획이다. 그동안 재식별 위험을 우려해 소극적이었던 AI기업들과 공공기관의 법적 부담을 대폭 덜어 데이터 활용을 촉진하겠다는 취지다.

양청삼 개인정보위 개인정보정책국장은 이달 23일 정부서울청사에서 열린 브리핑에서 "2020년 데이터3법이 도입된 후 가명정보 제도는 정보주체의 동의 없이 AI 학습이나 연구 등 공익 목적으로 데이터를 활용하는 수단이 됐다"며 "다만 현장에서는 재식별에 따른 법적 책임과 가명 처리에 드는 시간, 비용 등으로 활성화가 어려웠다"고 말했다.

이번 혁신방안의 핵심은 공공데이터 확보에 걸리는 시간과 절차를 획기적으로 줄이는 것이다. 현재 평균 310일이나 소요되는 데이터 제공 협의부터 결합, 반출까지의 전 과정을 2027년까지 100일 이내로 단축한다. 필요한 서류도 기존 최대 24종에서 13종으로 대폭 통폐합하고 공공기관의 가명 처리 전 과정을 지원하는 원스톱 서비스를 내년부터 제공한다. 개인정보위가 지정한 전문기관이 가명 처리의 적정성을 직접 확인해줌으로써 데이터 제공 기관의 행정적 부담도 크게 덜 것으로 전망된다.

담당 공무원의 법적 리스크도 완화한다. 양 국장은 "가명 처리 업무는 높은 전문성을 필요로 하지만 법적 책임 때문에 활성화가 어려웠다"며 "불완전한 가명 처리만으로는 제재하지 않는다는 방침을 명확하게 세우고 공무원 면책도 규정할 것"이라고 설명했다.

개인정보위의 '가명정보 제도·운영 개선방안' 추진 방향 /자료 제공=개인정보위

정부는 제도의 실효성을 높이기 위해 다각도의 인센티브와 인프라 확충에도 나선다. 현재 2.3% 수준인 공공기관의 가명정보 제공 경험 비중을 2027년까지 50%로 끌어올리는 것이 목표다. 개인정보위는 법 적용이 불명확한 상황에서 행정조치 대상 여부를 신속히 회신하는 '가명정보 비조치 의견서'도 연내 도입한다. 행정안전부는 올해부터 685개 행정·공공기관 평가에서 가명정보 제공 실적을 가점 항목으로 반영하고 기업의 환경·사회·지배구조(ESG) 평가에도 관련 실적을 포함한다.

또 개인정보이노베이션존을 전국 5개 기관으로 확대하고 내년부터 클라우드 연계 서비스를 제공해 AI기업들이 안전한 환경에서 가명정보를 활용할 수 있도록 지원한다. AI 개인정보 특화 석·박사 과정도 내년부터 신설해 관련 전문인력 부족 문제를 해결한다.

가명정보 제도의 취지는 과학적 연구와 논문 작성을 위해 데이터를 모으는 것이다. 다만 AI 학습에서도 데이터 가명 처리를 기술적 안전조치로 활용해 접근성을 높일 수 있다. 양 국장은 "'챗GPT'같은 범용 AI모델용 종합 데이터 제공에는 여전히 한계가 있다"며 "다만 가명 처리 가이드라인을 구체화해 AI 학습을 위한 데이터 처리에서도 굉장한 효율성을 보장할 수 있다"고 밝혔다.

이번 대책에는 데이터3법 시행 이후 기대에 못 미친 가명정보 활용률을 끌어올려 AI산업의 경쟁력을 확보하려는 정부의 의지가 결집돼 있다. 양 국장은 "기대보다는 가명정보의 활용도가 상당히 떨어졌다"며 "최소 50차례 이상의 의견수렴을 거쳐 근본적인 제도개선에 나선다"고 강조했다.

연말까지 구체화한 가명 처리 가이드라인이 발표될 예정으로, 실제 현장에서의 개선 효과가 주목된다. 고학수 개인정보위원장은 "AI시대에는 고품질 데이터를 충분히 확보해 혁신을 촉진하는 것이 곧 국가의 핵심 경쟁력"이라며 "현장에서 데이터를 더 쉽고 원활하게 활용할 수 있는 기반을 다져나가겠다"고 말했다.

이진솔 기자

Copyright © 블로터