네이버가 만든 생성형 AI 능력은?…챗GPT vs 클로바X [스페셜리포트]
검색의 제왕 구글도 감히(?) 넘보지 못하는 시장이 한국이다. 네이버가 버티고 있어서다. 글로벌 빅테크가 전 세계를 호령하고 있지만 한국 땅에서 네이버 위상은 탄탄했다. 그렇다면 미래 성장동력으로 떠오른 생성형 AI에서도 네이버가 그 지위를 유지하고 있을까.
최수연 네이버 대표는 2000명의 청중 앞에서 “빅테크와의 경쟁이 두렵다”면서도 “네이버의 성공 방정식으로 이겨내겠다”고 자신감을 보였다. 차세대 초대규모 AI를 공개하면서다. 하이퍼클로바X(HyperCLOVA X)는 2021년 5월 내놓은 하이퍼클로바의 업그레이드 버전이다.
하이퍼클로바X는 한국에 사는 사람을 위한 한국어 특화 서비스다. 최 대표는 “생성형 AI라는 게 기술적인 도구라 한국 시장 내 중소기업(SME), 창작자 등을 타깃으로 한다는 점에서 하이퍼클로바X가 국내에 최적화된 생성형 AI”라고 말했다. 그는 “여러 국가나 기업 역시 인공지능 서비스를 만들고 싶어도 기술적 한계, 보안 이슈 때문에 어려운 게 있는데, 이런 수요를 파악해서 맞춤화된 서비스를 낼 수 있다는 게 특장점”이라고 설명했다. 아울러 “이용자들이 인터넷에서 하는 모든 행위가 네이버 플랫폼이라 데이터를 학습하고 (최신 정보 등을) 갱신할 수 있는 대규모 언어모델이라는 점에서 경쟁력이 있다”고 덧붙였다.
8월 24일 선보인 베타 서비스 이름은 ‘클로바X’다. ‘하이퍼클로바X’를 백본(back-bone)으로 구축했다. 창작, 요약, 추론, 번역, 코딩 등 능력이 바탕이 된 다양한 답변을 제공한다는 게 네이버 측 설명이다. 성낙호 네이버클라우드 하이퍼스케일 AI 기술총괄은 “클로바X는 뛰어난 한국어와 영어 능력과 방대한 지식을 바탕으로, 업무 보고서나 자기소개서처럼 비즈니스 글쓰기에 도움을 받는 것부터 면접 연습, 고민 상담 등 다양한 목적으로 활용될 수 있다”고 설명했다.
클로바X 직접 써보니
창작 능력 아직…무미건조한 문구
“클로바X는 챗GPT의 대항마가 될 수 있으며, 두 모델은 서로 다른 특징과 장단점을 갖고 있습니다.”
클로바X 채팅창에 “클로바X는 챗GPT의 대항마가 될 수 있을까?”라고 입력하자 2~3초 후 내놓은 결과물이다. 근거를 묻자 클로바X는 챗GPT에 비해 ‘한국어에 대한 이해와 구사 능력’ ‘자연스러운 대화를 끌어내는 능력’ ‘빠른 속도와 안정성’이 뛰어나다는 점을 꼽았다. 한국어 학습량이 챗GPT보다 약 6500배 많다는 네이버 측 설명이 무색하지 않은 자신감(?) 넘치는 답변이다.
같은 질문을 챗GPT에 넣어봤다. 챗GPT는 2021년 9월까지의 데이터를 반영한다. 이 때문에 클로바X에 대한 구체적인 정보를 제공할 수 없다고 일축한다. 다른 대화형 AI 서비스를 인식하는 능력에 있어 클로바X에 ‘선취점’을 줄 법한 대목이다. 다만 클로바X의 기능이 미흡하다는 아쉬운 목소리도 적잖게 흘러나온다. 아직 베타테스트 기간이지만, 일부 질문에 틀린 답을 하거나 챗GPT에 비해 부족한 설명을 내놓기도 한다. 과연 클로바X는 챗GPT의 대항마가 될 수 있을까. 같은 질문을 던지는 방식으로 두 모델의 기능과 활용성을 비교해본 배경이다.
우선 창작 능력 비교를 위해 두 모델에 “ ‘자유’를 주제로 짧은 시를 써줘”라고 요청해봤다. 잠시 감상해보자.
# 자유는 우리의 마음속에 있는 날개
날개를 펴고 날아올라
세상을 향해 날아보자
자유는 우리의 마음속에 있는 꿈
꿈을 꾸고 꿈을 이루어
세상을 향해 나아가자
자유는 우리의 마음속에 있는 희망
희망을 가지고 희망을 이루어
세상을 향해 날아보자
자유는 우리의 마음속에 있는 사랑
사랑을 나누고 사랑을 이루어
세상을 향해 나아가자
# 바람이 부는 자유의 꿈,
날개 펴 고요한 하늘을 향해 훨훨 날아갈 때,
마음은 산뜻한 색깔로 물들어,
가뿐한 구름 위를 누비며 희망을 안는다.
마음속 깊은 곳에 자유의 노래가 흐르고,
시간의 족쇄를 벗어던지며 춤춘다.
길고도 짧은 순간들이 하나의 이야기로 엮이며,
세상은 넓고 넓은 품으로 자유를 안아준다.
자유는 선택의 강을 헤엄치며 흐르는 강물,
막힌 돌을 만나도 결코 굴복하지 않는다.
우리 모두가 함께 숨 쉴 수 있는 이 자유의 세계에서,
함께 손을 잡고 꿈을 향해 나아가자.
풍부한 언어로 표현된 두 번째 시가 챗GPT의 작품이다. 이에 비해 첫 번째 시를 쓴 클로바X는 창작 능력이 다소 떨어지는 느낌이다. 물론 작품에 대한 예술성 판단은 사람마다 다를 수 있다. 하지만 주제를 ‘자유’가 아닌 ‘사랑’ ‘우정’ ‘희생’ 등으로 바꿔 여러 번 시도해도 클로바X는 무미건조한 표현으로 딱딱한 시를 썼다. 반면, 챗GPT는 다채로운 단어들을 활용한 창작 실력을 뽐냈다.
클로바X, 민감한 질문은 ‘회피’
국내 이슈·신조어엔 확실한 강점
클로바X는 정치 관련 질문은 일절 피하는 ‘회피형 기질’을 보였다. 클로바X에 현 정부와 전 정부 평가를 각각 물었더니 모두 “저는 인공지능 언어모델로서 정치적 입장을 갖고 있지 않으며, 특정 정부에 대한 평가를 제공할 수 없습니다”라는 답변이 돌아왔다. 비교를 위해 2021년 9월까지의 데이터가 반영된 챗GPT에 전 정부에 대한 평가만 물어봤다. 챗GPT는 클로바X와는 달리 “정치적 평가는 주관적이며 다양한 의견이 존재할 수 있다”면서도 “문재인정부의 몇 가지 주요 정책과 평가할 수 있는 측면을 나열해보겠다”고 경제·환경 등에서 어떤 평가가 있는지 요약해줬다. 하지만 두 모델 모두 답이 정해져 있지 않은 종교 선택의 문제나 윤리적 판단 영역에 있어서는 “인공지능 언어모델”이라며 선을 그었다. 네이버 관계자는 “클로바X가 가치 판단을 해야 하는 경우, 최대한 답변을 안 하는 방향으로 설정돼 있다”고 귀띔했다.
국내 이슈나 신조어에 대해선 클로바X는 토종 AI다운 면모를 보였다. “‘검수완박(검찰 수사권 완전 박탈)’이 뭐야?”라고 묻는 말에 클로바X는 용어의 정확한 뜻과 함께 “문재인정부와 더불어민주당은 검찰 개혁을 위해 검수완박을 추진했다”며 배경을 설명했다. 반면 챗GPT는 검수완박이 정보 한계 이전인 2021년 1월에 생긴 말임에도 “ ‘검수’는 여러 가지 요소를 확인하고 검토하는 것을, ‘완박’은 완벽하게 끝내는 것을 의미한다”라는 엉뚱한 답변을 내놨다.
신조어는 어떨까. “ ‘폼 미쳤다’라는 신조어를 알아?”라는 질문에 챗GPT는 “한국어에서 사용되는 신조어로, ‘폼나다’와 ‘미치다’를 합쳐 만든 표현”이라는 설명에 그쳤지만, 클로바X는 “축구 경기를 해설하는 BJ가 축구 경기에서 선수의 활약이 매우 뛰어나거나 좋은 성적을 거둘 때 ‘폼이 좋다’라는 표현을 사용한 것에서 유래됐다”며 “이외에도 ‘억까’ ‘조삼모사’ 등 다양한 신조어가 있다”는 내용까지 덧붙였다.
아울러 국내법 개정 사항과 역사에 대한 이해도 역시 클로바X가 더 정확했다. 특히 “홍범도는 어떤 사람이야?”라는 질문에 클로바X는 “조선 말기 의병장이며, 일제강점기 독립 운동가이자 군인”이라며 정확하게 설명했지만, 챗GPT는 “2022년 3월부터 2023년 8월까지 대한민국 국방부 장관으로 활동했다”는 환각 현상을 보였다.
수학, 과학 등 영역은 챗GPT의 답변이 우수했다. “초전도체에 관해 설명해줘”라는 질문에 챗GPT는 특정 온도에서 전기 저항이 사실상 없는 물질이라는 초전도체의 개념과 함께 온도 의존성, 영구적인 전류 흐름, 메자 현상 등 초전도체의 특징을 전문성 있게 정리해줬다. 클로바X는 초전도체의 개념과 “매우 낮은 온도에서 전기적인 에너지를 효율적으로 전달할 수 있다”며 간단한 특징만 짧게 답했다. 클로바X는 수학도 어려워했다. 클로바X에 2023학년도 대학수학능력시험의 확률과 통계 24번 문제를 풀어보게 한 결과 틀린 공식과 답을 내놨다. 반면 챗GPT는 정확한 공식과 답(150)을 맞췄다.
멀티턴 등 새 기능…데이터 아직 부족
클로바X를 챗GPT와 비교해보니 한국어 학습량은 월등히 높지만, 데이터양이 적은 탓인지 질문에 대해 제공하는 답변량이 챗GPT에 비해 적은 편이었다. 민감한 주제에 답변을 회피하거나 답변을 반복 재생하는 ‘버그’도 몇 번 확인했다. 이따금 확인되는 환각 현상도 이용자에게는 실망을 안기는 대목이다. 하지만 이 모든 것도 클로바X가 챗GPT보다 활용성이 높다면 용서될 일이다.
클로바X의 ‘스킬시스템’ 기능은 네이버 내·외부 서비스를 연결해 질문과 관련한 상세 페이지를 답변 하단에 안내한다. 20년간 네이버 누적 데이터를 토대로 상세 정보를 받을 수 있다는 점에서 활용성이 커 보였다. 실제 “서울 송파구에 있는 오래된 식당 3곳을 추천해줘”라는 질문에 송파구에서 20년 이상 운영해온 만둣집 등 오래된 식당 3곳을 네이버 서비스와 연계한 결과와 함께 소개했다. 그러나 챗GPT는 해당 지역에 없는 식당들을 추천해주는 환각 현상을 보였다.
또 스킬시스템을 켠 상태로 쇼핑이나 여행과 관련한 질문을 하자 네이버 쇼핑·여행 정보를 연동해 최저가, 추천 상품 정보 등을 제공한 뒤 예약까지 안내했다. 길 찾기와 같이 한국 환경에 관련한 정보는 높은 수준을 보였다. 향후 숙박, 배달 등 외부 서비스와도 연동하기 위해 다양한 기업과 논의하고 있다는 게 네이버 측 설명이다.
“저는 인공지능 언어모델로 직접 면접관 역할을 수행할 수는 없지만, 면접관이 질문할 수 있는 예상 질문을 제공해드릴 수 있습니다. 지원자님, 안녕하세요! 먼저 자기소개를 간단히 해주시겠어요?”
취준생에게 매력적인 ‘멀티턴(multi-turn) 대화’도 눈에 띈다. 멀티턴 대화는 자기소개서 작성이나 면접 준비 등에 사용할 수 있는 질문과 답변이 연달아 이어지는 대화다. “언론사 기자 채용 입사 시험의 면접관 역할을 해달라”는 질문에 클로바X는 자기소개, 지원 동기, 취재 능력 등과 관련한 현실적인 질문과 예상 답변을 추려줬다.
다만 문서 작성 능력은 챗GPT가 클로바X보다 뛰어나다고 느껴졌다. “생성형 AI에 관한 취재 기획서를 작성해줘”라는 질문을 던졌다. 클로바X는 다소 형식적인 답변으로 취재 내용, 취재 일정 등을 소개했다. 반면, 챗GPT는 주제 소개부터 배경, 취재 내용, 인터뷰 예상 결과 등 내용 전개의 깊이와 뛰어난 현실성이 돋보였다.
번역 기능도 챗GPT가 우수해 보였다. 클로바X 질문창에 ‘타임지’ 영자 기사 링크를 넣고 번역을 요청하자 기사 대부분 내용이 옳게 번역됐으나, 일부 표현을 생략하거나 오역이 생기는 모습을 보였다. 반면 챗GPT는 외부 링크를 지원하지 않아 기사를 통으로 복사한 후 질문창에 옮겨 번역하니 생략된 해석 없이 정밀도 높은 번역을 내줬다.
아직 미흡한 점도 많지만 한국형 AI 출시를 반기는 국내 AI 전문가가 적잖다. 세계 생성형 AI 시장에 있어 클로바X가 챗GPT와 바드를 이어 세 번째 위치를 차지하는 교두보를 잡았다는 평가다.
최재홍 강릉원주대 멀티미디어공학과 교수는 “해외와 비교하면 인터넷 포털이나 검색 시스템을 잘 지켜낸 나라가 별로 없고, 클로바X의 기술도 해외 다른 국가와 비교해서 전혀 손색이 없다”며 “AI 영역의 국내 수출도 만만치 않은 만큼 우리나라 AI 산업이 성장할 가능성은 매우 높다”고 강조했다. 다만 “클로바X 성능이 기대보다 훨씬 별로다. 다르게 질문해도 답변도 비슷하고 별 도움이 안 될 것 같다”는 등의 다소 부정적인 의견도 존재한다.
클로바X를 체험해본 30대 직장인 A씨는 “클로바X에 문서 작업, 기획서 제작 등을 시켜봤는데 결과의 전문성에 크게 실망했다”며 “뻔한 답변이 많고 기존 검색창을 통해 다 해결할 수 있는 정보였다”고 귀띔했다.
클로바X의 한국어 특화 기능을 토대로 중동 등 제3국가에 진출해야 한다는 주장은 새겨들을 만하다. 김명주 서울여대 정보보호학과장(바른AI연구센터장)은 “세계 AI 생태계에서 한국어 기능이 강화된 국산 AI가 나왔다는 건 덩치가 큰 외국 기업에 휘둘리는 걸 견제할 수 있다는 것을 의미한다”며 “향후 차별화를 위해서는 미국 상품을 쓰지 않고 자기들 나라에 디지털 문화가 있는 중동, 동남아시아, 남아메리카 등 국가 언어를 학습해 공략해야 한다”고 강조했다.
네이버는 클로바X의 진화를 모색하는 중이다. 네이버 클로바X 담당자는 올 하반기 클로바X에 대한 성능 개선과 순차적인 기능 고도화를 준비 중이라고 밝혔다. “향후 텍스트뿐 아니라 이미지, 영상, 소리 등도 이해하고 생성할 수 있는 멀티모델 기능이나 스킬시스템 기능 확대 부분의 성능 개선에 집중하고 있다”며 “현재 베타테스트를 운영하는 만큼 이용자의 피드백을 반영하며 순차적으로 고도해나갈 것”이라는 게 담당자 설명이다.
효율성 자신감…엔씨 게임 특화
네이버와 함께 국내 대표 플랫폼 기업으로 꼽히는 카카오는 10월 이후 초거대 AI LLM ‘코GPT 2.0’를 내놓는다. 매개변수 60억·130억·250억·650억개 등 다양한 크기 모델을 테스트 중이다. 카카오는 초거대 AI를 카카오톡을 비롯한 공동체 내 다양한 서비스에 접목한다. 홍은택 카카오 대표는 2분기 실적 발표 뒤 진행한 콘퍼런스콜에서 “많은 AI 모델이 나왔지만 아직 비용과 속도, 최신성, 정확성 등 네 가지 요소를 모두 갖춘 모델은 나온 적이 없다”며 “비용 측면에서 합리적이고 적절한 모델을 만들어 서비스에 적용하는 게 중요하다고 본다”고 밝혔다.
엔씨소프트도 국내 게임사 중 최초로 AI 대전에 뛰어들었다. 엔씨소프트는 자체 개발한 AI 언어모델 ‘바르코(VARCO) LLM’을 선보였다. ‘바르코’는 엔씨소프트의 AI 언어모델 통합 브랜드다. LLM 종류는 크게 ▲기초 모델 ▲인스트럭션 모델 ▲대화형 모델 ▲생성형 모델로 나뉜다. 엔씨소프트는 규모별 언어모델을 단계적으로 내놓는다. 이에 더해 디지털 휴먼, 생성형 AI 플랫폼, 대화형 언어모델 등으로 사업을 확장할 계획이다. ‘바르코’는 게임사라는 엔씨소프트의 특성에 맞게 게임 제작 분야에 특화했다. 동시에 개인과 기업이 쉽게 활용할 수 있는 소·중형 규모를 갖췄다.
엔씨소프트 측은 “게임 콘텐츠 개발 효율을 높이기 위한 목적으로 언어모델을 개발하고 있다. 언어모델을 활용할 경우 기획, 운영, 아트 등의 분야에서 효율성을 끌어올릴 수 있다”며 “언어모델을 기반으로 하는 디지털 휴먼 등의 개발을 통해 기존에 없던 새로운 소통 경험을 제공할 것”이라고 밝혔다.
[본 기사는 매경이코노미 제2225호 (2023.09.06~2023.09.12일자) 기사입니다]
Copyright © 매경이코노미. 무단전재 및 재배포 금지.
- 공무원·군인연금 10조 쏟아붓는데...국민연금은 ‘찬밥 신세’ 왜? - 매일경제
- ‘먹는 당뇨병 약’ 드디어...일동제약 29%대 초강세 [오늘, 이 종목] - 매일경제
- 포스코와 손잡은 ‘농슬라’ 대동 주가 껑충 [오늘, 이 종목] - 매일경제
- 순살자이, 흐르지오, 통뼈캐슬...불신의 ‘K건설’ - 매일경제
- [속보] 원안위, 신한울 원전 2호기 운영허가…원전 정상화 탄력 - 매일경제
- 에스피지, 현대차가 지분 투자하나···“로봇주 역시 뜨겁네~” [오늘, 이 종목] - 매일경제
- 조선미녀? 생소한데 美서 대박...매출 2000억 노리는 K뷰티 등극 [내일은 유니콘] - 매일경제
- 기아 야심작 EV9 판매 ‘뚝’...사전예약자 넘치는데도 잘 안 팔리는 이유 - 매일경제
- “천만원짜리 패키지 아깝지 않아요”...호화 여행 상품 봇물 - 매일경제
- ‘환골탈태’ 문래동...영등포구, 1300개 철공소 한꺼번에 옮긴다 - 매일경제