한국어에 능하지만 글짓기·전문지식에 약한 네이버 CLOVA X
‘대기 등록하기'.
8월 29일 네이버의 대화형 인공지능(AI) 서비스 '클로바X'(베타 버전) 홈페이지에 접속하자 이 같은 검정 버튼이 떴다. 버튼을 눌러 대기 등록 절차를 마쳤더니 "순차적으로 클로바X에 가입할 수 있으며 가입 가능한 시점에 등록한 메일 주소로 안내 메일을 발송해주겠다"는 문구가 등장했다. 네이버가 8월 24일 한국어에 특화된 초거대 생성형 AI '하이퍼클로바X'와 그를 기반으로 한 클로바X를 공개하면서 클로바X를 체험하려는 대기자 행렬이 이어진 것이다. 네이버는 서비스 초기 안정화를 위해 25일부터 클로바X 가입자 수를 제한하고 있다.
클로바X는 한국형 '챗GPT' '바드'를 표방하는 만큼 한국어 구사에 특장점을 지녔다. 대기를 마친 8월 30일 클로바X는 사투리, 신조어나 밈(meme) 같은 고난도 질문에도 척척 답변을 내놓았다. "제주 사투리로 여름에 관한 문장을 만들어달라"는 질문에 클로바X는 "여름이렌 허난 더워부난 멘도롱헌 해수욕장이 최고주게(여름에는 더워서 시원한 해수욕장이 최고다)" "여름이넨 허난 물놀이허젠 바다이영 계곡이영 사람덜이 모다들주게(여름에는 물놀이를 하기 위해 바다와 계곡에 사람들이 모여든다)" 등 제주 사투리를 제대로 이해한 듯한 문장을 생성해냈다.
‘맑눈광' 뜻도 아는 클로바X
네이버 쇼핑·여행과 API 연동
클로바X는 또 기존 네이버 서비스와 API(응용프로그램 프로그래밍 인터페이스)가 연동돼 쇼핑, 여행예약 등을 편리하게 할 수 있다. 클로바X의 질문 입력 프롬프트에는 끄고 켤 수 있는 'S(스킬)'라는 기능이 있는데, 이를 켠 채로 질문을 입력하면 답변과 함께 네이버 쇼핑·여행 페이지로 이동 가능한 링크가 첨부된다. 예를 들어 "9월 초 강릉으로 여행을 가려고 하는데 호텔 좀 찾아줄 수 있느냐"고 질문하면 강릉에 위치한 여러 호텔을 장점과 함께 소개한 뒤 각 호텔의 네이버 여행 페이지 링크를 첨부하는 식이다. 이는 챗GPT, 바드 등 여느 AI 챗봇에는 없는 기능으로, 네이버는 향후 이를 쏘카, 야놀자, 배달의민족 등 타사와 연계해 지속적으로 확대해나간다는 계획이다.물론 클로바X에는 약점도 있었다. 글짓기나 수학·과학 등 전문지식에 대해서는 챗GPT, 바드에 비해 떨어지는 답변을 내놓았다. 클로바X는 '삼성전자'를 주제로 1000자 분량의 소설을 써달라는 요청에 소설이 아닌 설명문을 생성해냈다. 삼성전자에 관한 일반론적인 설명을 1000자 분량으로 나열하는 데 그친 것이다. 동일한 요구에 대해 챗GPT는 컴퓨터와 기술에 관심 많은 소년 '준호'가 삼성전자에 입사해 중책을 맡게 되는 이야기를, 바드는 '혁신의 꿈'이라는 제목을 바탕으로 삼성전자 내 한 연구팀의 신기술 개발 성공 스토리를 만들어냈다. 또한 상온 초전도체의 개발 원리를 묻는 질문에 챗GPT는 구체적인 가설과 이론을 제시한 반면, 클로바X는 기초적인 과학 지식과 함께 "아직 명확한 원리를 알 수 없다"고 비교적 짧게 답을 마쳤다.
학습용 데이터는 해결 과제
하지만 이 같은 네이버의 수익화 구상이 계획대로 진행되기까지 해결해야 할 과제가 산적해 있다. 네이버 또한 해외 빅테크 기업들처럼 AI 학습용 데이터 수집과 관련해 '저작권 침해' '공짜 학습'이라는 비판을 받고 있기 때문이다. 앞서 네이버는 하이퍼클로바X 학습에 50년 치 네이버 뉴스와 9년 치 네이버 블로그 게시물을 활용했다고 밝힌 바 있다. 이에 한국신문협회는 8월 22일 "뉴스 저작물에 대한 적정한 대가를 저작권자에 지급하도록 보상 체계를 마련하라"는 내용의 입장문을 발표했다. 네이버 블로그나 카페 게시물 학습과 관련해서도 현재 공정거래위원회가 이용 약관의 불공정 여부를 들여다보고 있다. 네이버가 AI 학습용 데이터 문제를 원만히 처리하지 못할 경우 수익화에서 핵심인 AI 성능 고도화에 차질을 빚을 수 있는 것이다.
이와 관련해 최수연 네이버 대표는 8월 24일 하이퍼클로바X 공개 행사에서 "(생성형 AI 학습에) 언론사가 동의하지 않으면 활용하지 않는 방향으로 계획을 잡고 있다"며 "이 자리에서 (대가 지급과 관련해) 명확한 답변을 내놓긴 어렵다"고 말했다. 네이버 관계자도 8월 31일 "기존 AI 학습용 데이터 수집은 철저히 네이버와 언론사, 네이버와 네이버 블로그·카페 이용자 간 체결한 약관을 바탕으로 했다"면서 "다만 학습용 데이터 수집이 전 세계적으로 이슈가 되고 있는 만큼 관련 글로벌 규제, 국내 정책 방향성을 지켜보면서 긴밀히 협조해나갈 것"이라고 설명했다.
이슬아 기자 island@donga.com
Copyright © 주간동아. 무단전재 및 재배포 금지.