中 알리바바, 새 AI 검색 훈련 기법 개발…훈련 비용 88% 절감

중국 빅테크(거대 정보기술기업) 알리바바가 외부 검색엔진을 사용하지 않는 새로운 인공지능(AI) 훈련 방법을 개발했다고 홍콩 사우스차이나모닝포스트(SCMP)가 12일 알리바바의 최신 논문을 인용해 보도했다.
논문 공개 사이트 아카이브(arXiv) 등에 발표된 이 논문에 따르면 구글 등에 고가의 응용 프로그램 인터페이스(API) 비용을 지불하지 않고도 정보검색 능력을 훈련할 수 있는 ‘제로서치’라는 새로운 강화학습 방식으로 훈련비용을 90% 정도 절감할 수 있는 것으로 나타났다.
알리바바 연구진은 논문에서 “효과적인 정보 검색은 대규모언어모델(LLM)의 추론과 생성 기능을 향상하는 데 필수적이지만, 검색엔진의 문서 품질을 예측할 수 없어 강화학습(RL) 과정에 불안정성을 초래하고 수십만 건의 검색 요청 등이 필요해 상당한 API 비용을 발생시킨다”고 지적했다.
연구진은 “이런 문제를 해결하기 위해 실제 검색엔진과 상호작용하지 않고도 LLM의 검색 능력을 훈련할 수 있는 ‘제로서치’를 도입했다”고 밝혔다.
‘제로서치’ 방식은 간단한 지도미세조정(supervised fine-tuning)을 통해 LLM을 검색 모듈로 변환해 쿼리(질의)에 대한 응답으로 관련성 있는 문서와 노이즈 문서를 모두 생성하도록 한다.
특히 구글 검색 API를 활용해 6만4000건의 질의를 처리하려면 586.7달러(약 82만1000원)의 비용이 들지만, 엔비디아의 A100 그래픽처리장치(GPU) 4개로 구성된 14B 모델에서 훈련하는 비용은 70.8달러로 88%의 비용 절감 효과를 얻을 수 있다고 강조했다.
황혜진 기자
Copyright © 문화일보. 무단전재 및 재배포 금지.
- [속보]한덕수, 김문수 제안 선대위원장 고사…사실상 선대위 불참
- 박지원 “암컷 기린상 한덕수, 욕심 과해 망해…착한 한덕수로 돌아가라”
- [속보]‘내란혐의’ 윤석열 첫 법원 공개 출석…포토라인 굳은 표정, 말없이 통과
- 빨강·파랑 섞인 운동화 신은 이재명 “이제 진보·보수는 없다”
- 하와이 간 홍준표 “권영세·권성동·박수영·성일종 은퇴하라…인간말종”
- ‘파란 김문수’ 현수막, 빗발친 항의에 결국…
- “쭉쭉빵빵” “춘향이 X먹으려고”…민주, ‘김문수 망언집’ 공개
- 김행, 윤석열 출당 요구에 “대통령이 스스로 판단하실 것”
- 강원FC 홈경기 춘천시장 출입제지 논란, 김진태 강원지사 “대신 사과”
- 여수공장 찾은 이준석 “나와 이재명의 일대일 대결 될것”