AI는 개인정보 먹깨비… 운세·스케줄까지 닥치는대로 수집

[AI시대의 윤리학: ③동반자 AI]
개인정보 둘러싼 AI의 태생적 딜레마

편집자주
인공지능(AI) 발전 속도가 무섭도록 빠릅니다. 몇 년 전 바둑에 통달하더니, 이젠 철학 에세이를 쓰고, 변호사 시험에 척 붙습니다. AI 전문가들조차 속도를 부담스럽게 여길 지경이죠. 그러나 이렇게 눈부시게 발전하는 AI를 ‘어떻게 쓸지’를 두고 아직 사회적 합의와 공감대가 형성되지 않았습니다. 인간의 목숨과 운명이 걸린 일에 AI를 활용할 수 있을까요? 이는 기술적 문제라기보단 인문학(윤리학)이 풀어야 할 질문입니다. AI 전성시대에 인간이 마주한 딜레마, 그 해결의 실마리를 함께 고민해 봅니다.

"일어날 시간이야, 철수!"

철수 씨는 오늘도 인공지능(AI) 기기가 울려주는 알람 소리로 하루를 시작한다. AI 추천 음악을 들으며 샤워를 하고, AI가 고른 뉴스를 들으며 샌드위치를 먹는다. 출근 복장으로 갈아입을 동안 AI가 오늘 날씨와 미세먼지 상황, 당일 스케줄을 알려준다. 모든 준비를 마치고 회사로 차를 몰고 가는 길, AI 내비게이션은 올림픽대로보다 강변북로를 이용하면 5분 더 일찍 도착할 수 있다고 출근경로를 제시한다. 회사에 도착해 AI에게 오늘의 운세를 물으니 재물운이 91%다. 몇 주 걸렀던 로또를 이번 주엔 사야겠다고 결심한다. 철수 씨 삶에서 이제 AI는 뗄 수 없는 관계다.

AI, 너 이렇게나 많은 정보를 모은다고?

기자가 구성해 본 철수 씨의 아침은 미래 일이 아니라, 이미 출시된 AI 서비스로도 가능한 지금의 일이다. 이미 여러 종류의 AI비서 서비스가 바쁜 현대인의 삶에 여러모로 도움을 주고 있다.

다만 AI를 즐겨 쓰는 사람들이 종종 놓치는 부분은 이 모든 AI 서비스가 '나와 타인의 세세한 개인정보'를 기반으로 한다는 점이다. AI는 이용 시작 시점에 처음 입력해 둔 개인정보에 만족하지 않는다. 서비스를 쓰는 내내 내 개인정보를 전송하고 남의 개인정보와 합친 다음, 가공해 정확도를 가다듬는다. AI가 발전할수록, 우리 삶에 가까이 다가올수록, 요구하는 개인정보도 많아진다.

비교적 세부적으로 수집 정보 내용을 고지하고 있는 SK텔레콤 AI비서 서비스 에이닷(A.)의 약관을 살펴보면, 맞춤형 AI가 어떤 개인정보를 수집하는지 알 수 있다. 에이닷을 가입하기 위해 필수적으로 동의해야 하는 '개인정보 수집 및 이용에 대한 동의'는 크게 13개 종류다. 이름·성별·생년월일·전화번호나 통화 기록·서비스 이용내역은 물론이고 △관심사·선호·취향 정보 △증권 정보 △선호 언론사 △운세·타로·심리테스트 결과 △캘린더(개인 일정)까지 매우 다양했다. SK텔레콤 관계자는 "에이닷은 오래된 정보도 기억해 콘텐츠를 추천하거나 대화에 활용하는 장기 기억 모델로 텍스트뿐 아니라 사진·음성까지 이해하도록 개발됐다"며 "사용자에 최적화된 서비스를 제공하기 위해 필수적인 정보만 수집하고 있다"고 설명했다.

개인정보 입력 없인 존재할 수 없는 AI

SK텔레콤 설명처럼 AI 시대의 개인정보 수집은 불가피한 측면이 있다. AI에게 데이터는 계속 먹어줘야 하는 '밥'과도 같다. AI 서비스는 방대한 데이터 위에서 탄생하며, 그 양과 질이 성능을 좌우한다. 챗GPT의 기반이 되는 GPT-3는 매개변수(파라미터)가 1,750억 개에 달한다. 국내 최초의 초거대AI 네이버 클로바는 학습을 위해 5,600억 개 토큰(데이터 단위)을 구축했다.

개발됐다고 끝이 아니다. AI를 이용하려면 얼굴, 음성, 글 등 정보를 입력해야 하며, 사용자 최적화나 오류 수정을 위한 재학습에도 데이터가 필요하다.

이렇게 개인정보를 끊임없이 먹어치우는 AI의 먹성 때문에, AI 서비스는 언제나 강화되는 방향으로 발전되어 온 우리 사회의 개인정보 보호 원칙과 충돌하고 있다. 개인정보 보호의 핵심 원칙 중 하나는 '최소한 정보만 수집하고 목적 달성 시 파기한다'는 최소 수집의 원칙이지만, AI는 방대한 데이터 처리가 없으면 존재할 수 없다. 특히 초거대AI처럼 고품질의 AI를 만들려고 할 때는 △최초 개인정보 수집 때 AI개발 목적을 미리 구체적으로 정하기 어렵고 △편향성 바로잡기 등 개선을 위해 장기 보관도 필요하다. 개인정보 보호의 원칙과 AI개발은, 모든 것을 뚫으려는 창과 모든 것을 막으려는 방패처럼 양립하기 어려운 관계다. 박도현 광주과학기술원(GIST) 법정책연구실 교수는 "개인정보 침해를 완전히 0으로 만드는 알고리즘은 기술적으로 불가능하다"며 "결국 우리가 해야 할 일은 어느 정도까지 용인할 것인지 합의를 도출하고 제도를 구현하는 일"이라고 말했다.

동의받지 않은 개인정보를 어쩔 것인가

개인정보와 관련한 법적 문제 없이 AI를 개발·출시하는 가장 확실한 방법은 정보주체의 동의를 받는 것이다. 이 때문에 AI 기업들은 되도록 넓은 범위에서 명확한 동의를 받으려 노력한다. 최근 출시된 GPT-4 기반의 챗봇 '아숙업'의 경우에는 카카오톡으로 친구 추가를 하고 '동의하는 경우에만 대화를 시작하라'고 약관 내용을 고지하는 방식으로 보다 자연스럽게 동의를 유도한다.

동의를 받지 않고 개인정보를 이용해 AI학습에 사용하는 방법도 있다. 정부는 2020년 '정보처리자는 통계작성, 과학적 연구, 공익적 기록보존 등을 위해 정보주체 동의 없이 가명 정보를 처리할 수 있다'고 데이터3법을 개정했다. 기업들이 가명 정보(추가 정보의 사용·결합이 있어야 특정 개인을 알아볼 수 있는 개인정보) 처리만 제대로 했다면, 이를 이용해 산업 목적의 AI까지 개발할 수 있도록 열어둔 예외 규정이다.

데이터 산업 활성화를 위한 결정이라는 게 정부의 설명이지만, 예외 규정은 여러 인권단체로부터 비판을 받았다. 법 개정 당시 국가인권위원회는 "과학적 연구의 범위를 객관적으로 예측할 수 있도록 보다 구체적이고 명확하게 규정해야 한다"며 "가명 정보 처리 시 정보주체의 권리가 보호될 수 있도록 하는 것이 바람직하다"는 의견을 표명했다.

동의 없는 개인정보 활용은 여전히 뜨거운 감자다. 앞서 법무부는 출입국 심사 고도화를 위한 'AI 식별추적 시스템 개발사업'을 진행하면서 개인정보 1억7,000여만 건을 정보주체 동의 없이 활용해 논란이 된 바 있다. 개인정보보호위원회는 현행법상 문제가 없는 개인정보 처리라고 판단을 내렸지만, 참여연대 등 시민단체는 기본권이 침해됐다며 헌법소원을 청구한 상태다. 이지은 참여연대 공익법센터 선임간사는 "가명정보는 원래 개인정보를 보다 안전하게 보관하기 위해 권장되는 안전장치였지만, 현재 국내에선 활용·결합·판매를 위한 면책으로 인식되고 있다"고 지적했다.

▶ AI법 집행주체는 과기부... 산업진흥 기관이 윤리감시까지

https://hankookilbo.com/News/Read/A2023041416150002942

▶ "사람 골머리 썩이는 일, AI시대에도 사람 몫으로 남겨야"

https://hankookilbo.com/News/Read/A2023041814070003921

최동순 기자 dosool@hankookilbo.com
이승엽 기자 sylee@hankookilbo.com
윤현종 기자 belly@hankookilbo.com

이 기사에 대해 어떻게 생각하시나요?

한국일보에서 직접 확인하세요. 해당 언론사로 이동합니다.

IT/과학