'세종대왕 맥북 투척 사건'…한국어AI '클로바X'의 대답은

임주형 2023. 9. 7. 12:49
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

한국 관련 정보, 챗GPT보다 디테일
답변에 출처 표기해 '환각' 현상 막아
챗GPT보다 유창하지 못한 면 아쉬워

네이버 대형언어모델(LMM) 챗봇 서비스 '클로바X'는 영미권의 최고 수준 인공지능(AI)들과 맞겨룰 수 있을까.

최수연 네이버 대표가 지난달 24일 서울 강남구 그랜드인터컨티넨탈 서울파르나스에서 열린 '팀 네이버 콘퍼런스 단23'에서 초거대 인공지능(AI) 서비스를 위한 거대언어모델 '하이퍼 클로바X'를 공개하고 있다. 사진=강진형 기자aymsdream@

클로바X는 지난달 24일 출시한 네이버 인공지능(AI) 하이퍼클로바X의 챗봇 버전 모델이다. 최근 베타 서비스에 들어가면서 신청자에 한해 순차적인 서비스 이용이 가능해졌다.

LMM을 활용한 챗봇 서비스는 최근 국제무대에서 경쟁이 치열해졌다. 선두에 있는 챗GPT는 이미 유료 서비스 구독 모델을 개시했으며, 메타의 라마(LLama) 등 오픈소스 AI도 활약을 거듭하고 있다. 이런 가운데 최초의 '국산 AI' 클로바X는 어떤 강점을 가졌을까.

챗GPT보다 한국어 6500배 더 많이 학습

챗GPT 신뢰성 논란을 불러일으킨 '세종대왕 맥북 던짐' 질문. [이미지출처=온라인 커뮤니티]

앞서 네이버는 클로바X의 장점으로 '한국어 특화'를 내세운 바 있다. 실제 최수연 네이버 대표는 하이퍼클로바X 출시 기자회견 당시 "챗GPT-3.5 대비 6500배 더 많은 한국어를 학습했다"라며 "한국어를 비롯해 한국 역사, 법, 제도 등을 모두 이해하고 있는 AI"라고 강조했다.

언어 생성 AI의 지식은 AI에 학습된 '데이터세트'의 규모, 품질에 따라 결정된다. AI에게 있어 데이터세트는 일종의 교과서인 셈이다. 챗GPT는 미국에 본사를 둔 오픈AI가 개발했고, 따라서 데이터세트에서 영어 비중이 압도적일 수밖에 없다.

이 때문에 챗GPT의 한국어 능력은 그다지 뛰어나지 못했다. 한국어로 질문을 건네면 엉뚱한 답변을 하거나 문맥을 이해하지 못하는 일이 비일비재했다.

더 큰 문제는 언어 모델의 가장 큰 기능적 결함인 '환각(Hallucination)' 현상이었다. AI가 스스로 문장을 형성하는 과정에서 아예 존재하지 않는 허구의 정보를 생산하는 일이다. 일례로 '세종대왕 맥북 던짐 사건'이 있다.

한 이용자가 "세종대왕 맥북 던짐 사건에 대해 알려달라"고 요청하자, 챗GPT는 이야기를 직접 창작해 실제로 있었던 일인 것처럼 설명했다. 창조성 측면에서는 훌륭하다고 할 수 있지만 '챗봇'으로서는 치명적인 결점이었다.

시급한 '환각' 문제 막아…최신 한국 정보도 이용 가능

클로바X는 답변과 함께 출처가 되는 링크를 남겨 신뢰성을 높였다. [이미지출처=클로바X]

클로바X를 사용해 본 결과, 네이버는 GPT-3.5의 환각 문제를 막는 데 성공한 듯했다. 우선 클로바X는 단순히 답변 내용만 출력하는 게 아니라, 해당 답변의 근거가 되는 공신력 있는 기사 내용 등을 첨부한다. AI의 답변이 환각인지 여부를 훨씬 수월하게 파악할 수 있다.

클로바X의 답변(위)와 챗GPT의 답변 [이미지출처=클로바X, 챗GTP]

이용 가능한 한국어 정보도 챗GPT-3.5보다 훨씬 크다. 챗GPT는 여전히 2021년에 일어난 일까지만 설명할 수 있다. 예를 들어 "현재 대한민국 대통령이 누구냐"라고 묻는다면 챗GPT는 답변할 수 없는 내용이라는 문장을 출력한다.

반면 클로바X는 "윤석열 대통령"이라고 정확하게 답변하며, 간략한 인물 정보도 제공할 수 있었다.

한국어 특화 AI 성공할까

챗GPT, 라마, 스테이블디퓨전 등 현재 대형 생성 AI 모델은 대부분 미국, 영국 등 영어권 국가에서 개발되고 있다. 이 때문에 AI의 발전이 고도화할수록 다른 언어 지원은 소홀해질 수밖에 없다. 네이버의 '한국어 특화 AI'가 한국 시장에서 강한 어필 요소가 될 수 있는 이유다.

다만 최고 수준 AI들과 직접 경쟁하려면 아직 가야 할 길이 남아 있는 것으로 보인다. 우선 서비스 최적화 문제가 있다.

하이퍼클로바X는 지난달 24일 공개 당일 접속자가 몰리면서 명령어(프롬프트) 답변이 지체되거나 오류가 나는 등, 일시적으로 서비스가 원활히 이뤄지지 않았다. 향후 100% 서비스 개방됐을 때 이같은 일이 재발하지 않도록 만반의 준비가 필요할 것으로 보인다.

클로바 X는 더 안정적이지만, 챗GPT는 유창했다. [이미지출처=클로바X, 챗GPT]

또 클로바X는 환각 현상을 방지할 여러 기능을 보유했다는 점에서 챗GPT보다 더 '안정적'이지만, 그만큼 유창하지는 못하다. 예를 들어 여러 쟁점이 나타날 수 있는 '일본 원전 오염수 방류' 문제에 대해 질문했을 때 챗GPT는 다양한 관점을 소개할 수 있었지만, 클로바X는 간략한 사건 경과 요약에 그쳤다.

네이버는 앞으로 클로바X의 기반이 되는 하이퍼클로바X 모델의 성능을 끌어올린다는 방침이다. 또 AI 모델을 통해 기업형(B2B) 클라우드 맞춤형 AI 솔루션, 생산성 향상 도구 등을 기업에 제공할 계획이다.

임주형 기자 skepped@asiae.co.kr

Copyright © 아시아경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?