한국어에 능하지만 글짓기·전문지식에 약한 네이버 CLOVA X

이슬아 기자 2023. 9. 4. 10:01
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

뉴스 저작물 학습 등 AI 고도화 위한 과제 산적

‘대기 등록하기'.

8월 29일 네이버의 대화형 인공지능(AI) 서비스 '클로바X'(베타 버전) 홈페이지에 접속하자 이 같은 검정 버튼이 떴다. 버튼을 눌러 대기 등록 절차를 마쳤더니 "순차적으로 클로바X에 가입할 수 있으며 가입 가능한 시점에 등록한 메일 주소로 안내 메일을 발송해주겠다"는 문구가 등장했다. 네이버가 8월 24일 한국어에 특화된 초거대 생성형 AI '하이퍼클로바X'와 그를 기반으로 한 클로바X를 공개하면서 클로바X를 체험하려는 대기자 행렬이 이어진 것이다. 네이버는 서비스 초기 안정화를 위해 25일부터 클로바X 가입자 수를 제한하고 있다.

클로바X는 한국형 '챗GPT' '바드'를 표방하는 만큼 한국어 구사에 특장점을 지녔다. 대기를 마친 8월 30일 클로바X는 사투리, 신조어나 밈(meme) 같은 고난도 질문에도 척척 답변을 내놓았다. "제주 사투리로 여름에 관한 문장을 만들어달라"는 질문에 클로바X는 "여름이렌 허난 더워부난 멘도롱헌 해수욕장이 최고주게(여름에는 더워서 시원한 해수욕장이 최고다)" "여름이넨 허난 물놀이허젠 바다이영 계곡이영 사람덜이 모다들주게(여름에는 물놀이를 하기 위해 바다와 계곡에 사람들이 모여든다)" 등 제주 사투리를 제대로 이해한 듯한 문장을 생성해냈다.

‘맑눈광' 뜻도 아는 클로바X

클로바X와 달리 ‘챗GPT’(GPT-3.5 버전)는 “‘맑눈광’이 무슨 뜻인지 아느냐”는 질문에 정답과는 거리가 먼 답변을 내놓았다. [클로바X 캡처]
"‘맑눈광'이 무슨 뜻인지 아느냐" "‘뉴진스의 하입보이요'가 어떻게 사용되는지 아느냐"고 물었을 때도 클로바X는 각각 "맑은 눈의 광인의 앞글자만 따서 지은 줄임말로 초롱초롱하고 맑은 눈, 순하지만 똑 부러져 보이는 표정, 호감을 보여주는 인상이지만 어딘지 모르게 광기가 느껴지는 사람" "걸그룹 뉴진스(NewJeans)의 노래 하입보이(Hype Boy)에서 유래된 밈으로 다양한 상황에서 뜬금없이 뉴진스의 하입보이요라고 말하고 춤추는 것"이라고 의미를 정확히 설명했다.
8월 30일 네이버의 대화형 인공지능(AI) 서비스 ‘클로바X’(베타 버전)에 “뉴진스의 하입보이요가 어떻게 사용되는지 아느냐”고 묻자 돌아온 답.[클로바X 캡처]
반면 경쟁사 챗봇인 챗GPT(GPT-3.5 버전)와 바드는 같은 질문에 어설프거나 완전히 틀린 답을 했다. 제주 사투리로 여름에 관한 문장을 만들어달라는 요구에 챗GPT는 "물방개 뜨거운 여름날, 제주 바닷가에서 시원하게 수영하마마"처럼 어미만 어색하게 흉내 낸 문장을 만들었고, 바드는 제주 사투리 없이 표준어로만 여름에 관한 문장을 생성했다. 여러 번 시도해도 결과는 같았다. 맑눈광의 의미를 묻는 질문에 챗GPT와 바드는 각각 "‘맑은 눈으로 보는 광경'이라는 뜻으로 어떤 상황에서 한눈에 보이는, 명확하게 인식되는 것" "맑은 눈을 가진 사람이 어떤 일에 몰두하거나 열정적으로 행동할 때 사용하는 표현" 등 정답과 거리가 먼 답변을 내놓았다.

네이버 쇼핑·여행과 API 연동

클로바X는 또 기존 네이버 서비스와 API(응용프로그램 프로그래밍 인터페이스)가 연동돼 쇼핑, 여행예약 등을 편리하게 할 수 있다. 클로바X의 질문 입력 프롬프트에는 끄고 켤 수 있는 'S(스킬)'라는 기능이 있는데, 이를 켠 채로 질문을 입력하면 답변과 함께 네이버 쇼핑·여행 페이지로 이동 가능한 링크가 첨부된다. 예를 들어 "9월 초 강릉으로 여행을 가려고 하는데 호텔 좀 찾아줄 수 있느냐"고 질문하면 강릉에 위치한 여러 호텔을 장점과 함께 소개한 뒤 각 호텔의 네이버 여행 페이지 링크를 첨부하는 식이다. 이는 챗GPT, 바드 등 여느 AI 챗봇에는 없는 기능으로, 네이버는 향후 이를 쏘카, 야놀자, 배달의민족 등 타사와 연계해 지속적으로 확대해나간다는 계획이다.

물론 클로바X에는 약점도 있었다. 글짓기나 수학·과학 등 전문지식에 대해서는 챗GPT, 바드에 비해 떨어지는 답변을 내놓았다. 클로바X는 '삼성전자'를 주제로 1000자 분량의 소설을 써달라는 요청에 소설이 아닌 설명문을 생성해냈다. 삼성전자에 관한 일반론적인 설명을 1000자 분량으로 나열하는 데 그친 것이다. 동일한 요구에 대해 챗GPT는 컴퓨터와 기술에 관심 많은 소년 '준호'가 삼성전자에 입사해 중책을 맡게 되는 이야기를, 바드는 '혁신의 꿈'이라는 제목을 바탕으로 삼성전자 내 한 연구팀의 신기술 개발 성공 스토리를 만들어냈다. 또한 상온 초전도체의 개발 원리를 묻는 질문에 챗GPT는 구체적인 가설과 이론을 제시한 반면, 클로바X는 기초적인 과학 지식과 함께 "아직 명확한 원리를 알 수 없다"고 비교적 짧게 답을 마쳤다.

학습용 데이터는 해결 과제

최수연 네이버 대표가 8월 24일 한국형 초거대 생성형 AI ‘하이퍼클로바X’ 공개 행사에서 기조연설을 하고 있다. [뉴스1]
네이버표 생성형 AI는 대체로 시장의 호평을 받고 있다. 다만 수익모델은 아직 뚜렷하지 않은 상황이다. 클로바X의 정식 출시 시점이나 유료화 여부 등도 정해지지 않았다. 9월 중 네이버의 검색용(큐:(Cue:))·기업용(프로젝트 커넥트X) AI 서비스가 시범 출시된다는 것, 11월 중 클로바X의 성능 개선이 한 차례 이뤄질 것이라는 것이 알려진 전부다. 다만 증권가에서는 네이버가 10월부터 B2B(기업 간 거래)를 시작으로 수익화에 주력할 것이라는 전망이 나온다. 이효진 메리츠증권 연구원은 네이버의 생성형 AI 사업과 관련해 "상반기가 챗봇 중심의 B2C(기업과 소비자 간 거래) 이벤트를 선보이는 과정이었다면 10월부터는 기업을 대상으로 수익화에 나설 것"이라고 말했다.

하지만 이 같은 네이버의 수익화 구상이 계획대로 진행되기까지 해결해야 할 과제가 산적해 있다. 네이버 또한 해외 빅테크 기업들처럼 AI 학습용 데이터 수집과 관련해 '저작권 침해' '공짜 학습'이라는 비판을 받고 있기 때문이다. 앞서 네이버는 하이퍼클로바X 학습에 50년 치 네이버 뉴스와 9년 치 네이버 블로그 게시물을 활용했다고 밝힌 바 있다. 이에 한국신문협회는 8월 22일 "뉴스 저작물에 대한 적정한 대가를 저작권자에 지급하도록 보상 체계를 마련하라"는 내용의 입장문을 발표했다. 네이버 블로그나 카페 게시물 학습과 관련해서도 현재 공정거래위원회가 이용 약관의 불공정 여부를 들여다보고 있다. 네이버가 AI 학습용 데이터 문제를 원만히 처리하지 못할 경우 수익화에서 핵심인 AI 성능 고도화에 차질을 빚을 수 있는 것이다.

이와 관련해 최수연 네이버 대표는 8월 24일 하이퍼클로바X 공개 행사에서 "(생성형 AI 학습에) 언론사가 동의하지 않으면 활용하지 않는 방향으로 계획을 잡고 있다"며 "이 자리에서 (대가 지급과 관련해) 명확한 답변을 내놓긴 어렵다"고 말했다. 네이버 관계자도 8월 31일 "기존 AI 학습용 데이터 수집은 철저히 네이버와 언론사, 네이버와 네이버 블로그·카페 이용자 간 체결한 약관을 바탕으로 했다"면서 "다만 학습용 데이터 수집이 전 세계적으로 이슈가 되고 있는 만큼 관련 글로벌 규제, 국내 정책 방향성을 지켜보면서 긴밀히 협조해나갈 것"이라고 설명했다.

*유튜브와 포털에서 각각 '매거진동아'와 '투벤저스'를 검색해 팔로잉하시면 기사 외에도 동영상 등 다채로운 투자 정보를 만나보실 수 있습니다.

이슬아 기자 island@donga.com

Copyright © 주간동아. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?