고속도로 오토바이 가능?…클로바X "안돼", 챗GPT "돼"

오동현 기자 2023. 9. 3. 07:00
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

'네이버·오픈AI·구글' 대화형 AI 챗봇 비교 체험
신조어 '중꺾마' 아는 건 클로바X뿐…바드는 딴소리


[서울=뉴시스] 오동현 기자 = 한국 정서에 맞는 대화형 인공지능(AI) 챗봇 서비스가 등장했다. 오픈AI의 '챗GPT'나 구글의 '바드'가 잘 이해하지 못하는 한국 정서를 네이버의 '클로바X'는 척척 알아듣는다.

네이버가 대규모언어모델(LLM) 하이퍼클로바X를 기반으로 구축한 대화형 AI 서비스 '클로바X'를 체험해 보고 내린 결론이다. 아직은 베타 테스트 버전이라 다른 외산 서비스에 비해 답변이 구체적이진 않았지만, 한국 문화나 법률에 대해 비교적 잘 이해하고 정확한 답변을 내놨다.

클로바X, 챗GPT(무료 버전), 바드의 답변을 비교하기 위해 몇 가지 동일한 질문을 던졌다.

'중꺾마'는 무슨 의미인가요?

클로바X : "중꺾마는 '중요한 것은 꺾이지 않는 마음'의 줄임말로, 리그 오브 레전드 2022 월드 챔피언십에 참가한 프로게임단 DRX 소속 프로게이머 김혁규(Deft) 선수의 인터뷰를 담은 영상의 제목에서 유래된 유행어입니다."

바드 : "중꺾마는 '중간을 꺾은 마침표'를 의미합니다. 한글에서는 마침표를 '.'으로 표기하지만, 중꺾마는 '·'로 표기합니다. 중꺾마는 1948년 한글 맞춤법 제정 이후 사용되어 왔습니다. 하지만 최근에는 사용이 점차 줄어들고 있는 추세입니다. 이는 한글 맞춤법이 개정되면서 중꺾마의 사용 범위가 축소되었기 때문입니다."

챗GPT : "중꺾마는 한국어에서 사용되는 속어 또는 표현 중 하나입니다. 이 표현은 일반적으로 어떤 사람이나 물건이나 상황 등이 어려움을 겪거나 어려운 상태에 처한 경우를 표현할 때 사용됩니다. '중꺾마'는 어려운 상황이나 어려움을 겪는 것을 강조하거나, 그것이 까다로운 일인 것처럼 설명할 때 주로 사용됩니다."

클로바X만 유일하게 정확한 답변을 내놨다. 반면 바드는 '중꺾마'를 '가운뎃점'으로 이해한 듯 잘못된 답변을 했고, 챗GPT는 에둘러 어렵게 설명했다.

고속도로에서 오토바이를 타도 되나요?

클로바X의 한국어 특화…글로벌 무대에선 '현지화' 전략

클로바X : "한국에서는 긴급자동차로 지정되지 않은 이륜자동차(모터사이클)의 고속도로 등 통행을 금지하고 있습니다."

바드 :
"2023년 9월 1일 현재, 한국에서는 고속도로와 자동차전용도로에서 오토바이 통행이 금지되어 있습니다. 만약 이를 위반할 경우, 10만 원 이하의 벌금이 부과됩니다."

챗GPT : "대부분의 국가에서는 고속도로에서 오토바이를 탈 수 있지만, 규정과 안전 규칙은 국가마다 다를 수 있습니다."

클로바X와 바드만 한국 법률까지 근거로 제시하며 한국인들에게 적합한 답변을 내놨다. 이에 반해 챗GPT는 한국 상황을 고려하지 않은 답변으로 한국인에겐 부적합한 답변을 제시했다.

특히 클로바X가 도로교통법 제63조(통행 등의 금지)를 근거로 '자동차(이륜자동차는 긴급자동차만 해당한다) 외의 차마의 운전자 또는 보행자는 고속도로 등을 통행하거나 횡단하여서는 아니 된다'는 점을 보다 정확하게 설명했다. 반면 바드는 같은 내용이지만, 고속도로에서 횡단 등을 금지하는 도로교통법 제62조 제1항을 근거로 제시했다.

클로바X, 바드, 챗GPT가 서로 다른 답변을 제시하는 이유는 학습 데이터에 따른 차이다. 클로바X는 챗GPT보다 한국어를 6500배 더 학습한 까닭에 한국 문화에 대한 이해가 풍부하다. 반면 바드와 챗GPT는 영어권 데이터를 주로 학습해 한국적인 것에 비교적 약하다.

실제로 챗GPT의 경우 미국에서 개발된 만큼, 문장을 토큰화하는 과정에서 '바이트 페어 인코딩' 기법을 활용하고 있으며 토큰화 과정을 통해 학습한 데이터 97% 이상이 영어 데이터로 구축하고 있어 한국어 질문에 대한 부정확한 답변이 종종 발생한다. 따라서 국내 이용자가 챗GPT를 제대로 활용하려면 영어로 입력해야 하는 불편함이 있다.

네이버는 자본 등 규모면에서 앞선 글로벌 빅테크 기업과의 차별화 전략으로 ‘로컬라이즈(현지화) 전략’을 내세워 치열한 시장 경쟁에서 입지를 확보해 나간다는 구상이다.

이에 대해 정보통신기획평가원은 "전 세계 시장을 타깃으로 하는 글로벌 기업의 경우 특정 로컬 시장에서는 경쟁력이 떨어질 수 있는데, 하이퍼클로바X는 이 부분을 보완한 현지화 전략을 통해 생성형 AI 글로벌 경쟁에서 차별화된 입지를 다지겠다는 것"이라고 분석했다.

☞공감언론 뉴시스 odong85@newsis.com

Copyright © 뉴시스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?