읽고 보고 추론하는 네이버 AI…'하이퍼클로바X 씽크' 공개

편지수 2025. 6. 30. 17:41
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

네이버가 '생각하는 힘'을 의미하는 추론 능력을 강화한 생성형 인공지능(AI) 모델 개발을 마쳤다.

AI 모델이 직접 답변계획을 수립하는 만큼 더 고도화된 답변이 가능하며, 언어뿐만 아니라 시각 정보를 이해해 추론하는 능력도 갖췄다.

네이버는 30일 추론(reasoning) 능력을 강화한 생성형 AI '하이퍼클로바X 씽크'(HyperCLOVA X THINK(하이퍼클로바X 씽크)의 테크니컬 리포트를 발표했다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

시각 추론서 유의미한 결과…큐원·GPT 제쳐
네이버는 30일 추론(reasoning) 능력을 강화한 생성형 AI '하이퍼클로바X 씽크'(HyperCLOVA X THINK(하이퍼클로바X 씽크)의 테크니컬 리포트를 발표했다. /사진=네이버 제공

네이버가 '생각하는 힘'을 의미하는 추론 능력을 강화한 생성형 인공지능(AI) 모델 개발을 마쳤다. AI 모델이 직접 답변계획을 수립하는 만큼 더 고도화된 답변이 가능하며, 언어뿐만 아니라 시각 정보를 이해해 추론하는 능력도 갖췄다.

네이버는 30일 추론(reasoning) 능력을 강화한 생성형 AI '하이퍼클로바X 씽크'(HyperCLOVA X THINK(하이퍼클로바X 씽크)의 테크니컬 리포트를 발표했다.

이번에 공개된 모델은 스스로 단계적으로 생각해 더 정확하고 유용한 답변을 내놓는 추론능력을 강화했다. 추론은 AI 에이전트 서비스의 핵심적인 기술로 주목받고 있다. 추론모델은 단순히 응답하는 데 그치지 않고, 복잡한 문제를 작은 단위로 나누고 답변하기에 적절한 도구나 함수를 선택한다. 

하이퍼클로바X 씽크는 추론 능력을 기반으로 언어에 대한 이해를 한층 높은 수준으로 끌어올렸다. 한국어 성능 벤치마크인 '코발트(KoBALT)-700'를 기준으로 언어능력을 측정한 결과, 하이퍼클로바 X 씽크는 48.9점을 기록했다. LG AI 연구원의 '엑사원 딥(32B)', 알리바바의 '큐원3(32B)'는 각각 33.0, 41.4였다. 

또다른 한국어 성능 평가 벤치마크인 '해례-벤치'(HAERAE-Bench)에서는 87.8을 기록했다. 비슷한 규모의 엑사원, 큐원이 70점대를 기록한 것과 비교하면 월등히 높은 점수다.

네이버는 하이퍼클로바X 씽크를 통해 AI가 언어뿐 아니라 시각 정보를 바탕으로도 추론할 수 있는 기술을 확보했다. 

이 모델은 'STEM'(과학·기술·공학·수학) 문제를 이미지 형식으로 입력했을 때 이를 인식해 추론하고, 정답을 맞히는 모습을 보였다. 한국 교육기반 벤치마크인 'KCSAT STEM'를 기준으로, 시각 인코더와 결합한 멀티모달 버전은 46.4점을 기록했다. 이는 GPT-4.1의 40.3점을 뛰어넘는 수준이다.

유강민 네이버클라우드 리더는 "이번 추론모델은 멀티모달 추론을 겨냥해 만든 것이 아님에도 시각 추론 영역에서 의미 있는 결과가 도출됐다"면서 "이미 하이퍼클로바X 기반의 이미지, 영상, 음성 멀티모달 기술을 확보하고 있으므로, 향후 더 강력한 멀티모달 추론 능력을 갖춘 모델로 고도화해나가겠다"고 말했다.

편지수 (pjs@bizwatch.co.kr)

ⓒ비즈니스워치의 소중한 저작물입니다. 무단전재와 재배포를 금합니다.

Copyright © 비즈워치. 무단전재 및 재배포 금지.