네이버, 'AI탭'에 숨긴 기술 3가지…"작지만 똑똑한 모델로 비용 효율화"

경량 LLM·하네스 엔지니어링·멀티모달로 실행형 AI 경쟁력 강화
AI탭 정식 출시 후 이용자 3배 이상↑…쇼핑·플레이스 이용 증가

이기창 네이버 클라우드 이사가 지난 2일 서울 강남구 네이버 D2SF 강남에서 '탐색에서 실행까지, 차세대 AI 기술이 만드는 네이버 AI 검색'을 주제로 테크 딥톡 세션에서 발표하고 있다. /네이버

[더팩트ㅣ최문정 기자] 네이버가 대화형 인공지능(AI) 검색 서비스 'AI탭'의 핵심 기술을 공개했다. 하루 수천만명이 이용하는 검색 서비스에 AI를 안정적으로 적용하기 위해 자체 경량 거대언어모델(LLM)과 AI 에이전트 운영 기술을 고도화하고, 검색부터 구매·예약 등 실행까지 연결되는 AI 검색 경쟁력을 강화한다는 전략이다.

네이버는 2일 서울 강남구 네이버 D2SF 강남에서 '탐색에서 실행까지, 차세대 AI 기술이 만드는 네이버 AI 검색'을 주제로 테크 딥톡 세션을 개최했다.

네이버는 지난달 26일 AI탭을 전 이용자를 대상으로 정식 출시했다. 출시 일주일여 만에 AI탭 이용자는 베타 서비스 당시보다 크게 늘어나며 순조로운 출발을 보였다.

한승균 네이버 AI 검색 서비스 리더는 "AI탭은 정식 출시 후 이용자가 베타 서비스 당시보다 3~4배 증가했다"며 "특히 쇼핑과 플레이스 액션카드를 사용하는 이용자도 크게 늘었다"고 밝혔다.

네이버는 AI탭 정식 출시를 앞두고 '프로덕트 네이티브 LLM'을 핵심 전략으로 내세워왔다. 프로덕트 네이티브 LLM은 자체 모델인 하이퍼클로바X(HCX)를 기반으로 검색을 넘어 예약·쇼핑·정보 탐색 등 실제 네이버 서비스에서 이용자의 과업을 수행하도록 설계된 AI 모델이다.

이기창 네이버클라우드 이사는 "기존 하이퍼클로바X는 폭넓은 지식과 추론 능력을 갖춘 범용 LLM으로 비교적 제한된 맥락에서 자연스럽고 정확한 답변을 생성하는 데 초점을 맞췄다"며 "차세대 모델은 긴 대화 맥락 속에서 멀티턴 대화를 이어가고, 상황에 맞는 도구를 적절히 선택해 이용자가 원하는 과업을 끝까지 수행하는 데 중점을 뒀다"고 설명했다.

이어 "차세대 모델의 지향점은 모든 벤치마크에서 1등을 하는 것이 아니라 이용자가 검색하고 구매하고 예약하는 실제 네이버 서비스에서 가장 잘 작동하는 모델을 만드는 것"이라고 강조했다.

네이버는 AI 모델의 연산 효율을 높이기 위해 'MoE(Mixture of Experts·전문가 조합)' 구조를 적용했다. MoE는 질문 유형에 맞는 '전문가 AI'만 골라 활용하는 방식으로, 모든 AI를 동시에 가동하는 기존 구조보다 연산량을 줄여 응답 속도와 비용 효율을 높일 수 있는 것이 특징이다.

또 검색·예약 등 실제 서비스와 연계한 강화학습을 통해 실행 능력을 높였다. 예를 들어 "강남 인근의 분위기 좋은 식당을 추천해줘"라는 질문이 들어오면 AI는 플레이스 검색 결과를 활용해 답변을 생성하고, 예약 가능 여부는 예약 정보를 관리하는 '로컬 인벤토리' 도구를 호출해 실시간으로 확인하는 방식이다.

AI 모델의 환각(할루시네이션)을 줄이기 위한 장치도 마련했다. 네이버는 '명료성 강화학습(Clarify RL)' 기법을 도입했다. AI가 모호한 질문을 받으면 임의로 답을 생성하는 대신 추가 질문을 통해 이용자의 의도를 확인하도록 학습하는 방식이다. 예를 들어 "그 드라마 주연 배우가 누구야?"라는 질문에 기존 모델은 특정 배우를 추측해 답변했다면, 차세대 모델은 "어떤 드라마를 말씀하시나요?"라고 되물어 필요한 정보를 먼저 확보한다.

네이버 자체 평가 결과 차세대 모델은 기존 하이퍼클로바X 대비 할루시네이션 비율이 최대 30%포인트 감소했다.

한승균 네이버 AI 검색 서비스 리더가 지난 2일 서울 강남구 네이버 D2SF 강남에서 '탐색에서 실행까지, 차세대 AI 기술이 만드는 네이버 AI 검색'을 주제로 테크 딥톡 세션에서 발표하고 있다. /네이버

네이버는 모델 정확도를 높이기 위해 '자기정책 기반 증류(OPD)' 기법도 적용했다. 실제 서비스에 적용하기 어렵지만, 성능이 뛰어난 '선생님 모델'이 서비스용 경량 '학생 모델'이 생성한 답변을 토큰 단위로 첨삭해 부족한 부분을 보완하는 방식이다.

이 이사는 "기존 강화학습은 특정 분야에 강점이 있는 모델들을 한 번에 학습시키기 쉽지 않았다"며 "사람에 비유하면 수학 성적을 올렸더니 국어 성적이 떨어지는 경우와 같다"고 설명했다.

이어 "OPD는 분야별 전문가 모델을 선생님으로 삼아 학생 모델의 일반적인 성능은 유지하면서 부족한 역량만 효과적으로 보완할 수 있는 장점이 있다"고 말했다.

네이버는 자체 벤치마크 결과 AI탭 모델이 '검색·구매·예약' 등 실행 품질을 평가하는 서비스 역량에서 글로벌 동급 모델 평균(100점)을 웃도는 108점을 기록했으며, 지시 이행과 도구 호출 등 기본 역량에서도 평균(100점)보다 높은 104점을 기록했다고 밝혔다.

AI 에이전트 운영 기술인 '하네스 엔지니어링(Harness Engineering)'도 공개했다. 하네스 엔지니어링은 LLM의 성능을 최대한 활용하면서 서비스 요구사항에 맞게 동작하도록 설계하는 운영 체계 전반을 의미한다. AI모델에게 일종의 '일머리'를 알려주는 방식인 셈이다.

네이버는 AI탭 운영 과정에서 비용 절감과 응답 속도 향상, 서비스의 유연한 고도화를 위해 하네스 엔지니어링을 적용하고 있다.

작업별로 특화된 소규모 언어모델(SLM)을 조합하는 분업형 구조를 적용해 운영 비용은 최대 3배 절감하고 응답 속도는 2배 이상 개선했다. 초기 설계 당시 20~30초 수준이던 답변 생성 시간도 현재는 평균 10초 수준으로 단축됐다.

한 리더는 "서비스에서 잘 작동하는 AI 에이전트를 만들기 위해서는 LLM 뿐만 아니라 비용 효율성과 안정성을 동시에 설계하는 하네스 엔지니어링이 필수"라고 말했다. 이어 "지난 27년 간 축적한 검색 인프라와 노하우, 블로그·카페 등 방대한 콘텐츠, 쇼핑·플레이스 등 다양한 서비스 자산을 AI 기술로 연결해 검색부터 실행까지 이어주는 경험은 누구도 쉽게 따라올 수 없는 네이버만의 경쟁력"이라고 말했다

윤상두 네이버 퓨쳐 AI센터 리더가 지난 2일 서울 강남구 네이버 D2SF 강남에서 '탐색에서 실행까지, 차세대 AI 기술이 만드는 네이버 AI 검색'을 주제로 테크 딥톡 세션에서 발표하고 있다. /네이버

네이버는 연내 AI탭에 텍스트와 이미지를 넘나드는 멀티모달 검색을 강화한다. 이미지 기반 검색을 넘어 이미지 한 장으로 탐색과 질의, 예약 등 실행까지 이어지는 AI 검색 경험을 구현한다는 목표다. 이를 위해 3500만 규모의 멀티모달 데이터셋을 구축했으며, 하나의 이미지를 반복 분석하지 않고 이미지와 대화 맥락을 함께 이해하는 'MuCo(Multi-turn Contrastive Learning)' 기술을 적용할 계획이다.

3분기에는 AI브리핑과 스마트렌즈를 AI탭과 더욱 긴밀하게 연동하고, 부동산 서비스를 AI탭에 적용할 예정이다. 웨일 브라우저 전용 AI 에이전트도 선보이며, 연내에는 논문과 학회 자료를 기반으로 건강 정보를 제공하는 건강 AI 에이전트를 출시할 계획이다.

윤상두 네이버 퓨처 AI센터 리더는 "네이버가 10년 가까이 스마트렌즈를 통해 축적한 시각 검색 기술은 AI 에이전트가 세상을 바라보는 '눈'을 만드는 핵심 기술"이라며 "향후 네이버 AI 에이전트는 텍스트뿐 아니라 이미지를 통해서도 이용자의 의도를 이해하고 실제 행동까지 연결하는 방향으로 진화할 것"이라고 말했다.

네이버는 자체 기술 고도화와 함께 글로벌 AI 협력도 확대하고 있다. 지난달 세계 12개 AI 기업이 참여하는 엔비디아의 AI 개발 연합체 '네모트론 연합'에 합류했다.

이 이사는 "네모트론 연합에 합류해 단순히 기술을 받아오는 수준을 넘어 함께 설계하고 발전시키는 단계까지 나아가고 있다"며 "연합에 모델 운영 경험을 제공하고, 연합의 연구 성과를 다시 자사 모델 고도화에 활용하는 양방향 협력 구조를 구축했다"고 말했다.

이어 "서비스 역량에서는 확실한 우위를 지향하고, 기본 역량은 경쟁사를 넘어서는 수준을 유지하며, 전문 역량은 글로벌 최고 수준과의 격차를 최소화하는 것이 목표"라면서도 "결국 가장 중요한 것은 이용자가 검색하고 구매하고 예약하는 실제 네이버 서비스에서 가장 잘 작동하는 AI를 만드는 것"이라고 거듭 강조했다.

jay09@tf.co.kr

발로 뛰는 더팩트는 24시간 여러분의 제보를 기다립니다.
▶카카오톡: '더팩트제보' 검색
▶이메일: jebo@tf.co.kr
▶뉴스 홈페이지: http://talk.tf.co.kr/bbs/report/write

더팩트에서 직접 확인하세요. 해당 언론사로 이동합니다.

경제

네이버, 'AI탭'에 숨긴 기술 3가지…"작지만 똑똑한 모델로 비용 효율화"