"한국에선 제대로 만들 수 없다" 챗GPT, 정부 문서 못 읽어

김국배 2023. 5. 11. 13:50
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

정부 문서 자료들이 인공지능(AI)이 읽을 수 없는 형태로 돼 있어 국내에서 '챗GPT' 같은 생성 AI가 나오기 어렵다는 지적이 나왔다.

엄열 과학기술정보통신부 인공지능기반정책관은 "한국어 생성 AI에 도움이 되는 학습용 데이터가 꾸준히 구축될 수 있도록 하겠다"고 했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

조승래 의원 주최 '챗GPT 시대 대응과 과제' 좌담회
"데이터 공개·학습 원칙 총괄할 국가 디지털책임자 필요"
AI 윤리 문제, 韓 리더십 발휘해야
초거대AI는 자본 싸움…"정부 공동 투자 등 지원 도움"

[이데일리 김국배 기자] 정부 문서 자료들이 인공지능(AI)이 읽을 수 없는 형태로 돼 있어 국내에서 ‘챗GPT’ 같은 생성 AI가 나오기 어렵다는 지적이 나왔다. ‘데이터가 없다’는 얘기다. AI가 가져올 위험에 대응하려면 ‘국제적 연대’가 필수라는 의견도 제기됐다.

(사진=조승래 의원실)

박태웅 한빛미디어 의장은 11일 조승래 더불어민주당 의원 주최로 국회의원회관에서 열린 ‘챗GPT 시대 대응과 과제’ 좌담회에서 “한국에선 챗GPT를 제대로 만들 수가 없다”며 “정부 자료들이 다 기계가 읽을 수 없는 형태로 돼 있고, 판결문도 30%만 열람이 가능하다”고 지적했다.

이날 발제자로 나선 박 의장은 이 문제에 대해 “데이터를 왜 공개하는지 합의가 없었기 때문”이라고 주장했다. 그러면서 그는 “미국의 경우 공공 데이터는 검색 가능하고, 누구나 접근할 수 있어야 하며 기계가 처리할 수 있어야 한다는 등의 원칙이 있어 이 원칙을 지키지 않으면 공공 데이터로 치지 않는다”며 “공공 데이터가 갖춰야 할 요건이 뭔지를 먼저 합의해야 한다”고 했다. 엄열 과학기술정보통신부 인공지능기반정책관은 “한국어 생성 AI에 도움이 되는 학습용 데이터가 꾸준히 구축될 수 있도록 하겠다”고 했다.

이 연장선상에서 국가 디지털책임자(CDO)가 필요하다는 의견도 나왔다. 한상기 테크프론티어 대표는 “정부 데이터 공개 뿐 아니라 학습하는 데 원칙을 결정하고 세우는 것 등을 총괄할 CDO가 있어야 한다”는 의견을 피력했다.

한 대표는 “AI 윤리 원칙을 세우는 데 한국이 리더십을 발휘해야 한다”고 했다. 그는 “국제적인 연대와 협력을 이끌어내는데 한국이 결코 단순한 ‘팔로워’가 되지 않을 수 있다”며 “한국은 대규모 언어 모델(LLM)을 만드는 회사가 5군데나 있고, 전 세계적으로 초거대 AI 생태계를 갖춘 국가는 미국·중국과 한국 정도밖에 없기 때문에 리더십을 발휘할 수 있는 영역이 있을 것”이라고 했다. 박 의장은 “기업들은 AI를 충분히 윤리적으로 학습시켰다고 주장하지만 어떻게 학습시켰는지 공개하지 않는다”며 “AI 윤리 문제는 소수의 IT 천재들에게 맡겨둘 순 없으며 국제적 연대로 풀어야 한다”고 했다.

초거대 AI 경쟁이 ‘쩐의 전쟁’이라 할 정도로 자본 싸움인 만큼 국내 기업에 지원이 필요하다는 요청도 나왔다. 하정우 네이버클라우드 AI혁신센터장은 “투자 비용이 엄청 많이 들어가기 때문에 세제 혜택이나 공공 활용을 조건으로 한 정부 공동 투자 등의 형태로 지원해준다면 도움이 될 것”이라며 “인터넷 초창기 이후 사실상 처음으로 초거대 AI라는 메인 스트림 기술 영역에서 ‘톱’ 포지션을 차지하고 있는 만큼 이 기회를 살리는 게 중요하다”고 말했다.

김국배 (vermeer@edaily.co.kr)

Copyright © 이데일리. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?