中 '콰이서우' 버전 챗GPT 공개...높은 평가 주목

유효정 중국 전문기자 2023. 8. 23. 08:40
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

중국 숏클립 영상 플랫폼 콰이서우가 자체 개발한 인공지능(AI) 언어 모델을 공개하고 테스트를 시작했다.

22일 중국 언론 징지관차왕에 따르면 콰이서우가 자체 개발한 대형 언어 모델(LLM) '콰이이(快意, KwaiYii)' 내부 테스트를 시작했다.

깃허브에 공개된 콰이이 소개에 따르면 콰이이는 콰이서우 AI팀이 0부터 1까지 독립적으로 개발한 대형 언어모델이다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

챗GPT 3.5 수준 근접

(지디넷코리아=유효정 중국 전문기자)중국 숏클립 영상 플랫폼 콰이서우가 자체 개발한 인공지능(AI) 언어 모델을 공개하고 테스트를 시작했다. 

22일 중국 언론 징지관차왕에 따르면 콰이서우가 자체 개발한 대형 언어 모델(LLM) '콰이이(快意, KwaiYii)' 내부 테스트를 시작했다. 개발진은 표준 애플리케이션프로그래밍인터페이스(API)와 맞춤형 프로젝트 협력 방안도 함께 공개했다.

주목할 점은 콰이이의 13B 버전(KwaiYii-13B)은 언어모델 성능 평가인 CMMLU 중국어 순위에서 1위를 차지했다는 것이다. 인문학 및 중국 관련 주제에서 평균 점수가 61점 이상을 기록했다. 이는 최근 샤오미와 바이두 등 중국 기업이 공개한 중국어 언어 모델 중 가장 높은 점수를 얻었다는 의미다. 

콰이서우의 콰이이가 파이브샷과 제로샷 양 부문에서 모두 1위를 기록했다. (사진=IT즈자)

이로써 콰이서우는 공식적으로 빅모델 트랙에 진입했다.

깃허브에 공개된 콰이이 소개에 따르면 콰이이는 콰이서우 AI팀이 0부터 1까지 독립적으로 개발한 대형 언어모델이다. 현재 다양한 매개변수 규모의 모델이 포함돼있으며, 사전 훈련된 모델 '콰이이베이스(KwaiYii-Base)'와 대화 모델 '콰이이 챗(KwaiYii-Chat)'이 있다.

이번에 공개된 버전은 13B 규모의 새 모델이다.

이 콰이이 13B 베이스 사전 훈련 모델은 뛰어난 범용 기술 기반 기능을 갖췄다고 소개됐다. 대부분의 권위있는 중국어 및 영어 벤치마크에서 동일한 모델 크기로 좋은 성과를 달성했다는 것이다.

예컨대 콰이이 13B 베이스 사전 훈련 모델은 현재 MMLU, CMMLU, C-이벌(eval) 및 휴먼이벌(Humaneval) 등 벤치마크에서 동일한 모델 크기 기준 선두에 있다.

콰이이 13B 챗 대화모델은 뛰어난 언어 이해 및 생성 기능을 갖췄다는 게 회사의 설명이다. 콘텐츠 생성, 정보 상담, 수학 추론, 코드 작성 및 여러 차원의 대화 등 광범위한 작업을 지원한다. 주류 오픈 소스 모델을 능가하면서 콘텐츠 생성, 정보 상담 및 수학 문제 해결에서 챗GPT 3.5에 근접한 수준이라고 소개됐다.

콰이서우 로고 (사진=콰이서우)

콰이서우 내부 관계자에 따르면 콰이이를 위해 회사 AI팀은 2022년부터 최근까지 이미 국제적 학회에 130여 편 이상의 딥러닝, 자연어처리, 이미지인식, 음성인식, 검색 등 영역 논문을 발표했다.

올해 7월엔 지능형 문답 제품을 내부적으로 테스트했으며, 한달 후 짧은 영상 검색 장면에 초점을 맞춰 사용자에게 질문과 답변, 텍스트 생성 등 기능을 제공하는 '콰이서우 AI 대화' 내부 테스트가 시작됐다.

매체에 따르면 이 콰이서우 AI 대화는 전통적 AI 모델과 달리 검색 장면의 개인화가 이뤄지는데 초점을 맞췄다. 대화형태로 사용자가 생활 상식과 서비스 문의 등 빠르게 정보를 찾을 수 있도록 도와준다. 비디오, 전문가, 백과사전 등이 사용자 질문에 맞춰 정보 결과를 추가로 검색하고 매칭시켜준다.

징지관차왕에 인용한 콰이서우 관계자는 성능 최적화가 반복적으로 이뤄지고 있으며 특히 멀티모달 기능의 연구개발에 투자하고 더 많은 기업 및 개인 사용자를 위한 빅모델 적용을 추진하고 있다.

유효정 중국 전문기자(hjyoo@zdnet.co.kr)

Copyright © 지디넷코리아. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?