`클로바X`, 쇼핑정보·맛집예약 편리하네

韓 특화… 사투리 이해력 최고
적은 정보량·추론 기능은 실망
네이버, 기능 고도화로 승부수

'클로바X'에게 'I Love You'를 각 지역 사투리로 바꿔 달라고 요청했을 때 제공된 답변. 팽동현 기자

한국형 챗GPT '클로바X'에 대한 이용자들의 반응이 가지각색이다. 네이버 AI(인공지능)에 대한 기대감이 컸던 만큼 실망감을 내비치는 이들이 있는가 하면, 출발선이 달랐음에도 글로벌 빅테크의 턱밑까지 추격한 기술력을 호평하는 시선도 있다. 전문가들은 이제 시작일 뿐, 앞으로가 중요하다고 강조한다.

네이버는 지난 24일 초거대AI '하이퍼클로바X'와 관련 서비스·솔루션들을 공개했다. 이 중 대표적인 서비스인 '클로바X'는 '하이퍼클로바X' 기반의 AI 챗봇으로, GPT-3.5나 GPT-4에 기반한 챗GPT와 같은 일반 사용자용 서비스다.

생성형AI 열풍 속에 국산 초거대AI 서비스에 목말라하던 이들은 이날 오후 4시부터 시작된 '클로바X' 베타 서비스 이용 신청에 몰렸다. 신청이 쇄도하면서 하루도 지나지 않아 대기 등록을 하고 기다려야 벌어지기도 했다. 네이버는 주말에 기술적 조치를 취해서 서비스 속도를 개선시켰다.

◇한국 이해와 여행·쇼핑정보 등 강점= 영화 '황산벌'에서는 '거시기'라는 사투리에 대한 이해도 차이로 다양한 상황이 연출된다. 오픈AI 챗GPT(GPT-4 기준), MS(마이크로소프트) 빙, 구글 바드, 네이버 클로바X에게 각각 '거시기하다'의 뜻을 물어보니 마찬가지로 다양한 답변이 나왔다.

챗GPT는 "표준 한국어에는 없는 표현으로, 제 지식 기준으로는 이 표현의 정확한 뜻을 알 수 없다"고 했고, 빙은 "'저기하다'와 같은 뜻으로, '큰 규모나 큰 범위에서 바라보다'라는 뜻"이라며 헛짚었다. 바드는 "표준어로, '말하기 난처하다, 쉽게 설명하기 어렵다'는 뜻"이라고 짚었고, 클로바X는 "전라도 사투리 거시기는 이름이 얼른 생각나지 않거나 말하기 곤란한 사람·사물을 가리킬 때, 할 말이 생각나지 않을 때 쓰는 감탄사로 표준어"라고 설명했다.

맛집 추천을 요청했을 때는 클로바X의 스킬시스템이 유용했다. 같은 지역임에도 4개 챗봇이 추천하는 맛집이 모두 제각각이기도 했는데, 정보 출처를 병기하는 빙과 달리 바드는 없는 음식점을 추천하기도 했다. 클로바X의 경우 각 맛집에 대한 설명과 함께 스킬시스템으로 예약까지 할 수 있어 편의성을 높였다.

스킬시스템으로 네이버쇼핑에서 필요한 상품을 찾는데도 유용할 것으로 보인다. 특정 상품에 대해 원하는 가격대와 네이버쇼핑 평점 조건 등을 질문에 담으면 맞는 상품을 추천해준다. 길찾기 등 한국 환경이나 한국 문화 관련해서는 더 높은 수준의 답을 제공했다.

이경전 경희대 경영학·빅데이터응용학과 교수는 "기존 하이퍼클로바나 GPT-3가 했던 실수들을 RLHF(인간 피드백을 통한 강화학습) 등으로 해결했음을 확인할 수 있었고, 역할 지정 프롬프트에도 상당히 잘 반응했다"며 "어떤 내용을 표로 구성하는 능력은 GPT-4보다 떨어지는 듯하나, 이는 GPT-4의 노이즈 강건성이 특출난 것일 뿐"이라고 평했다.

◇"초거대AI 종속되지 않을 기반 마련한 것 의미"= 이용자들은 기능에 실망감을 나타내기도 했다. 클로바X는 질문에 대해 제공하는 정보량이 타 서비스에 비해 적은 편이다. 한국어 학습에 집중했지만 전체 데이터양은 비교적 적은 게 원인으로 보인다. 영어 질문 시는 경쟁 서비스에 비해 품질 차이가 더 눈에 띈다. 할루시네이션(환각·거짓말) 문제도 마찬가지로 안고 있다. 추론(reasoning) 기능도 비교적 약하다는 지적이 있다.

3시간에 30개로 제한된 답변 수도 소비자의 원성을 사지만 품질 불만도 있다. 개인정보 보호나 저작권 침해 등을 이유로 답변을 하지 않는 경우가 잦은 편이다. 인물이나 신조어 등에 대해서는 최신 정보까지 반영해 더 나은 답을 주지만, 그 내용이 나무위키나 블로그에서 그대로 가져온 것일 때가 많다. 이마저도 동일한 질문에 대해 스킬시스템을 켰을 때에 한해 답하지 않는 경우도 있다. 답변을 반복 재생하는 버그도 간혹 있다.

그럼에도 전문가들은 '클로바X'에 대해 대체로 호의적인 평가를 내린다. 한국어라는 특수한 언어에 대해 글로벌 빅테크들과 견줄만한 LLM(대규모언어모델) 기술력을 단기간에 확보했고 이들에게 종속되지 않을 기반을 마련했다는 점에서다. 비용 문제 때문에 지속가능성에 의구심도 제기되는 GPT-4보다는 지난 연말 등장한 GPT-3.5 기반 챗GPT와 비교하는 게 여러모로 타당하고, 그럴 경우 한국에서 쓰기에 충분한 장점을 갖췄다는 것이다.

김명주 서울여대 바른AI연구센터장은 "생성형AI로서 기본적으로 갖춰야 할 것은 다 갖췄다. 사회주의 가치 반영 등을 강제하므로 글로벌 스탠다드가 되기 어려운 중국 쪽을 제외하면 네이버가 동메달은 된다고 본다"며 "혐오 표현이나 랜섬웨어 제작 등을 막기 위한 조치에도 힘을 기울인 것으로 보인다. 영어 데이터 학습량이 비교적 적어 보이는 게 아쉽긴 하나, 이 때문에 글로벌 서비스에 비해 탈옥 위험성은 더 낮을 수도 있다"고 설명했다.

네이버는 올 11월 클로바X에 대한 성능 개선 등 순차적인 기능 고도화를 준비 중인 것으로 알려졌다. 향후 배달의민족·야놀자 등 다양한 외부 파트너와의 협력을 통한 스킬시스템 확대가 특히 기대되는 대목이다. B2C 분야에서 가능성을 입증하고 B2B 분야에서 본격적인 수익화를 노린다는 게 '팀 네이버'의 전략으로, 이제 시작인 '클로바X'도 보여줄 게 아직 많이 남아 있을 것으로 보인다.

김형철 SPRi(소프트웨어정책연구소) 소장은 "네이버 하이퍼클로버X는 글로벌 빅테크의 초거대AI에 종속되지 않도록 국내 이용자들에게 선택의 기반을 마련해 줬다는 점에서 의미가 있다"면서 "일단 시작했다는 게 중요하고, 앞으로 다양한 생태계와 엮어서 쓸모 있게 키워가는 게 중요해 보인다"고 말했다.

전용준 리비젼컨설팅 대표는 "아직 베타서비스인 점을 감안하면 현재로선 비교 대상은 지난해 말 챗GPT 공개 시점이 돼야 겠고, 앞으로 얼마나 좋아질지는 지켜볼 필요가 있다"며 "향후 네이버 LLM은 민원 처리 관련 업무를 비롯해 정부·공공 수요를 일정 수준 이상으로 얼 만큼 충족시키느냐가 승부처"라고 밝혔다.팽동현기자 dhp@dt.co.kr

디지털타임스

IT/과학

`클로바X`, 쇼핑정보·맛집예약 편리하네