개인정보 가명처리 더 쉽게… AI 학습 돕는다

김영욱 2024. 6. 3. 11:01
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

KISA, '개인정보 안심구역' 운영
2025년 데이터 생성량 181ZB 전망...70% 이상이 '개인정보'
개인정보 안심구역 운영...유용한 데이터 확보, 연구 환경 제공
데이터의 가명처리 과정. <자료:KISA>

인공지능(AI) 열풍으로 개인정보 보호와 학습용 데이터의 중요성이 동시에 커진 가운데 정부가 안전한 '가명정보' 활용을 뒷받침하는 체계를 강화된다. 개인정보의 가명처리를 심하게 할 경우 AI 학습 데이터로 활용 가치가 떨어지는 만큼 '개인정보 안심구역'을 통해 AI 학습용에 적합한 가명처리를 돕는 게 핵심이다. 또 공공데이터 관련 법을 개정해 공공기관장이 개인정보가 포함된 공공데이터를 가명처리해 외부에 제공할 수 있도록 규제를 완화한다.

3일 관련 기관에 따르면 개인정보보호위원회와 한국인터넷진흥원(KISA)은 AI시대의 개인정보 활용을 지원하기 위해 개인정보 안심구역을 운영하고 있다. 개인정보 안심구역은 데이터 처리의 안전성을 확보해 AI와 비정형데이터 요구에 보다 유연하게 활용할 수 있도록 제도 중 하나다. 외부 사용자는 물론, 내부 사용자도 무조건 신뢰하지 않고 데이터 처리 과정 전체를 검증하는 '제로 트러스트' 원칙 하에 외부와 차단된 보안환경에서 보다 유연하게 개인정보 처리를 하도록 지정한 공간이다. 이곳에서는 연구자와 스타트업들이 개인정보를 보다 유연하고 탄력적으로 활용할 수 있다. 현재 통계청과 국립암센터가 시범 운영 중이다.

개인정보 안심구역에서는 데이터 품질이 저하되는 수준의 과도한 가명처리 대신, 적정한 수준의 가명처리와 다양한 결합키 활용이 가능하다. CCTV 영상을 비롯한 '비정형 데이터'의 경우 가명처리를 위해 많은 시간이 필요했는데 안심구역에서는 전문심의위가 검증한 가명처리 소프트웨어를 적용하고 샘플링 검사 이후 비정형데이터를 활용할 수 있도록 허용한다.

이 같은 활동은 데이터 패권 경쟁에서 우위를 선점하고 데이터 전략자산을 확보하는 동시에 데이터 신사업을 키우기 위한 국가 아젠다의 일환이다. 앞으로 데이터 전략의 성패는 활용가치가 높은 개인정보를 얼마나 잘 활용하느냐가 좌우할 전망이다. IDC가 2021년에 발간한 보고서에 따르면 전 세계 연간 데이터 생성량은 2020년 64ZB에서 2025년 181ZB로 증가할 전망인데 이 중 70% 이상이 개인정보다. 181ZB는 개당 4GB의 풀HD 영상 약 4조개에 달하는 규모다.

개인정보위는 개인정보 보호를 위해 2020년 개인정보보호법을 시행하고 가명정보 결합과 관련된 고시를 시행, 개정해왔다. 작년 3월에는 개인정보보호법도 개정했다.

가명정보는 데이터 가치는 최대한 유지하면서 개인정보 일부 또는 전부를 삭제·대체해 추가정보 없이는 개인을 알아볼 수 없도록 한 정보로, 통계 작성·과학적 연구·공익적 기록 보존 등 3가지 목적하에 정보 주체 동의 없이 활용할 수 있다. 특히 최근 가명처리를 통해 개인정보를 보호하면서 민간에서 AI에 학습시킬 만한 데이터를 확보하는 게 최근 핵심 과제가 됐다. 추가정보 없이 개인을 특정할 수 없도록 개인정보를 일부 삭제하면 특정 개인 식별 가능성이 낮아져 데이터 유용성이 떨어지기 때문이다. 가명정보 처리 가이드라인에 따르면 개인정보의 가명처리는 목적 설정 등 사전 준비, 위험성 검토, 가명처리, 적정성 검토, 안전한 관리 순으로 이뤄진다.

정부는 공공데이터의 제공 및 이용 활성화에 관한 법률, 데이터기반행정 활성화에 관한 법률 개정도 추진한다. 이 중 공공데이터법 개정안은 공공기관장이 개인정보가 포함된 공공데이터를 가명처리해 제공할 수 있도록 규제를 완화하는 것이 골자다. 김정주 KISA AI프라이버시팀장은 "최근 AI 기술과 산업이 급속도로 발전하면서 AI에 활용할 수 있는 가명정보 수요가 커졌다"면서 "가명처리를 심하게 하면 AI 학습 데이터로 활용 가치가 떨어지는 만큼 개인정보 안심구역을 통해 양질의 AI 학습용 데이터가 생산될 수 있도록 지원하겠다"고 밝혔다.

한편, KISA와 개인정보위는 가명정보 활용 활성화를 위해 △가명정보 컨설팅 사업 △가명정보 인재 양성과정 △가명정보 지원 플랫폼 사이버 훈련장 시연 △가명처리 등을 직접 체험해 볼 수 있는 가명정보 활용 지원센터 견학 등을 운영하고 있다.

김영욱기자 wook95@dt.co.kr

Copyright © 디지털타임스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?