“표·도형문제도 푼다” … 똑똑해진 네이버 AI
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
인공지능(AI)에 시험지를 이미지로 인식하게 하면 100점 만점에 80점 이상 정답을 맞히는 국내 멀티모달 기술이 공개됐다.
22일 네이버는 대화형 AI 비서 '클로바X'에 시각 언어 모델 '하이퍼클로바X 비전'을 적용하자 이 같은 결과가 나왔다고 밝혔다.
네이버는 '클로바X'에 실제 대한민국 초·중·고등학교 검정고시 총 1480개 문항을 AI 모델에 이미지 형태로 입력한 결과, 84%의 정답률을 기록했다고 밝혔다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
정답률 84%… GPT-4o보다↑
인공지능(AI)에 시험지를 이미지로 인식하게 하면 100점 만점에 80점 이상 정답을 맞히는 국내 멀티모달 기술이 공개됐다.
22일 네이버는 대화형 AI 비서 ‘클로바X’에 시각 언어 모델 ‘하이퍼클로바X 비전’을 적용하자 이 같은 결과가 나왔다고 밝혔다. 네이버는 ‘클로바X’에 실제 대한민국 초·중·고등학교 검정고시 총 1480개 문항을 AI 모델에 이미지 형태로 입력한 결과, 84%의 정답률을 기록했다고 밝혔다. 이는 오픈AI의 GPT-4o(포오·78%)로 풀었을 때보다 더 높은 수준의 정답률이라고 네이버는 설명했다.
네이버는 오는 27일부터 클로바X에 이미지 관련 서비스를 새로 추가한다. 기존에는 논리적 글쓰기, 코드 작성, 번역 등 텍스트 위주 작업만 가능했으나 이 기능을 통해 이미지나 그림 형식으로 된 표, 그래프를 이해하고 분석할 수 있게 되는 것이다.
도형이나 차트, 그래프 등을 만드는 데 필요한 고차원적인 코딩에도 클로바X를 쓸 수 있다. 우상향 곡선 그래프를 주고 ‘그림에 나오는 차트를 최대한 비슷하게 생성하는 파이썬(프로그래밍 언어) 코드를 작성해줘’라고 주문하면, 클로바X는 이에 맞는 코드를 바로 만들어낸다. 한글뿐 아니라 영어, 한자, 일본어가 쓰인 이미지도 이해 가능하다.
클로바X는 이미지와 함께 유머나 문화까지도 이해할 수 있게 된다. 예를 들면 ‘하이퍼클로바X 비전’이 적용된 대화형 AI 비서 ‘클로바X’에 석양이 지는 해변 사진을 주고 ‘시를 지어달라’고 부탁하면, 클로바X는 “해변에 앉아 금빛 물결을 바라보네. 하늘은 붉은빛으로 물들어가고 구름 사이로 해가 숨바꼭질을 하네….” 문구로 시작된 총 4개 연(聯)의 시를 제공한다.
네이버 관계자는 “하이퍼클로바X 비전은 이미지·텍스트 쌍으로 구성된 다량의 데이터를 학습하기에 이러한 밈(meme·인터넷 유행 콘텐츠)에 대한 이해가 가능하다”고 했다.
이예린 기자 yrl@munhwa.com
Copyright © 문화일보. 무단전재 및 재배포 금지.
- “건강했던 명문대 대학원생 딸”…양재웅 운영 병원 사망 가족, 고인 사진 공개
- ‘청담동 술자리 의혹’ 첼리스트 “태어나서 윤석열·한동훈 본 적 없어”
- “내 정자, 50만 원에 판매중”…억만장자의 고백
- [속보]아파트 흡연장서 70대 이웃 때려 숨지게 한 20대 체포
- “내가 왜 잡혀가”…술 취해 경찰 폭행한 ‘빙그레 3세’ 재판행
- 아무리 주차공간이 없었어도…철로에 차 놓고 간 젊은 남녀
- 음주 운전하다 사고 내고 숲으로 도망…어떻게 잡혔나
- 군부대 교회 女화장실서 발견된 몰카…설치한 사람은 목사
- “아내 포함 42명 살해·유기” 연쇄살인 용의자, 감방 쇠창살 끊고 도주
- “제가 왜 출국금지죠?”…파출소 찾아온 외국인 남성의 정체