하이퍼클로바X, 챗GPT·제미나이보다 한국어 이해력 높았다
‘토종 인공지능(AI)’인 네이버 하이퍼클로바X가 한국판 AI 성능 평가에서 오픈AI, 구글의 생성형 AI보다 높은 점수를 받았다.
네이버클라우드는 하이퍼클로바X가 한국판 AI 성능 평가 체계 ‘KMMLU(Measuring Massive Multitask Language Understanding in Korean)’에서 오픈AI, 구글AI보다 높은 점수를 기록했다고 27일 밝혔다.
KMMLU는 국내 오픈소스 언어모델 연구팀인 ‘해례(HAE-RAE)’가 이끄는 AI 성능 평가 지표 구축 프로젝트다. 인문학, 사회학, 과학·기술 등 45개 분야에서 전문가 수준의 지식을 묻는 3만5030개 문항으로 구성돼 있다. 수학적 추론 능력과 같이 전 세계 공통으로 적용할 수 있는 지식을 묻는 문항이 80%, 한반도 지리·국내법 등 한국 특화 문제 해결 능력을 평가하는 문항이 20%다. 이 지표는 한국어 문제들로 구성돼 AI의 한국어 이해 역량을 더 정확하게 평가할 수 있으며, AI의 보편적 능력과 지역 지식을 고르게 측정해 한국 사용자에게 유용한 AI를 종합적으로 판단할 수 있다.
KMMLU 연구 논문에 따르면, 하이퍼클로바X는 오픈AI의 GPT-3.5-터보(Turbo)와 구글의 제미나이 프로(Gemini-Pro)보다 높은 점수를 기록했다. ‘정확도’를 측정한 전체 점수는 하이퍼클로바X가 54.32점으로 제미나이 프로(48.64점)와 GPT-3.5-터보(42.47점)에 앞섰다. 한국 특화 지식 질문에서도 하이퍼클로바X(55.21점)가 가장 높은 점수를 얻었다. 이는 교육·법률 등 국내 정보의 중요성이 큰 산업 분야에서는 하이퍼클로바X가 가장 유용할 수 있다는 의미라고 네이버클라우드는 설명했다.
네이버클라우드는 KMMLU를 통해 입증된 성능 경쟁력을 바탕으로 하이퍼클로바X를 보안과 성능을 모두 갖춘 ‘소버린(Sovereign) AI(국가의 데이터 주권과 규제 준수를 보장하기 위해 개발된 인공지능)’ 솔루션으로 발전시킬 계획이다.
배문규 기자 sobbell@kyunghyang.com
Copyright © 경향신문. 무단전재 및 재배포 금지.
- “나도 부정선거라 생각했다”···현장 보고 신뢰 회복한 사람들
- 국힘 박상수 “나경원 뭐가 무서웠나···시위대 예의 있고 적대적이지도 않았다”
- 늙으면 왜, ‘참견쟁이’가 될까
- 공영방송 장악을 위한 이사장 해임 “모두 이유 없다”…권태선·남영진 해임무효 판결문 살펴
- 내란의 밤, 숨겨진 진실의 퍼즐 맞춰라
- ‘우리 동네 광장’을 지킨 딸들
- 대통령이 사과해야 되는 거 아니에요? 사과해요, 나한테
- 독일 크리스마스 마켓에 차량 돌진…70명 사상
- [설명할경향]검찰이 경찰을 압수수색?···국조본·특수단·공조본·특수본이 다 뭔데?
- 경찰, 경기 안산 점집서 ‘비상계엄 모의’ 혐의 노상원 수첩 확보