"그리 견제했건만"…8개월 만에 메타 눌렀다는 中 AI스타트업

김희정 기자 2023. 11. 7. 06:10
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

중국 베이징에서 오픈AI의 챗GPT4에 버금간다고 주장하는 인공지능(AI) 스타트업의 오픈소스 AI 모델이 출시됐다.

01.AI의 오픈소스 기반 대규모 언어 모델(LLM)인 Yi-34B는 전세계 개발자들이 중국어와 영어로 사용할 수 있다.

01.AI는 오픈소스 모델을 넘어서는 비즈니스 전략을 구상하고 있다.

01.AI는 오픈소스 모델을 구축한 결정적 이유로 대다수의 AI 개발자가 비싼 모델을 감당할 수 없거나 필요로 하지 않는다는 점을 들었다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

컴퓨터과학자 카이푸 리가 3월 창업한 AI스타트업 01.AI,
오픈소스 기반 언어모델 Yi-34B 출시, 중국어·영어 공용…
필요한 반도체칩 올해 초부터 비축, '챗GPT4' 벤치마킹
카이푸 리 01.AI 최고경영자/사진=블룸버그통신

중국 베이징에서 오픈AI의 챗GPT4에 버금간다고 주장하는 인공지능(AI) 스타트업의 오픈소스 AI 모델이 출시됐다. 창업 8개월 만에 10억달러(약 1조3000억원)의 기업가치를 인정받은 AI(인공지능) 스타트업 '01.AI' 얘기다.

컴퓨터 과학자이자 벤처캐피탈 기업 시노베이션벤처스 최고경영자(CEO)인 카이푸 리는 5일(현지시간) 블룸버그와의 인터뷰에서 이 같이 밝혔다. AI 분야 베스트셀러 저자이기도 한 리는 01.AI의 창업자로서 CEO도 맡게 됐다.

리는 지난 3월 팀을 구성해 6월부터 01.AI 운영을 시작했다. 벤처캐피털로 자리를 옮기기 전 구글, 마이크로소프트, 애플 등에서 근무했던 그는 미국 기업에서 근무했던 동료들과 해외에서 일했던 중국인들을 영입해 100명이 넘는 팀을 꾸렸다. 이 팀에는 AI 전문가뿐만 아니라 인수합병부터 기업공개 전문가까지 포함됐다.

01.AI의 오픈소스 기반 대규모 언어 모델(LLM)인 Yi-34B는 전세계 개발자들이 중국어와 영어로 사용할 수 있다. LLM은 대량의 데이터를 학습해 인간과 유사한 텍스트, 이미지, 코드를 읽고 이해하고 생성하는 컴퓨터 알고리즘이다. 주요지표에서 Yi-34B는 시장에 출시된 주요 오픈 소스 모델보다 성능이 뛰어나며, 메타의 라마2(Llama2)를 능가하는 것으로 나타났다. 다양한 카테고리에서 최고 성능의 LLM에 대한 리더보드를 운영하는 허깅페이스(Hugging Face)는 사전 학습된 기본 LLM 중 01.AI의 LLM을 1위로 평가했다.

리 대표는 "메타의 라마2는 오픈소스 커뮤니티의 표준이자 큰 공헌을 한 제품"이라며 "우리는 중국뿐 아니라 글로벌 시장에 우수한 대안을 제공하고자 한다"고 말했다. 또 미국의 대중 반도체칩 판매 제한에 대해서는 "유감스럽다. 필요한 칩을 비축하고 있고 이를 위해 시노베이션 벤처스로부터 돈을 빌리기도 했다"고 덧붙였다.

01.AI는 오픈소스 모델을 넘어서는 비즈니스 전략을 구상하고 있다. 챗GPT4를 벤치마킹해 특정 산업이나 경쟁 상황에 맞는 독점적 대안을 마련하겠단 방침이다. 영어와 중국어로 AI 시스템을 제공하면 은행, 보험사, 무역회사 같은 글로벌 기업에 유리하다는 입장이다. Yi-34B는 학습에 사용되는 340억 개의 매개변수에서 이름을 따왔지만 이미 1000억 개 이상의 매개변수 모델을 개발 중이다.

01.AI는 오픈소스 모델을 구축한 결정적 이유로 대다수의 AI 개발자가 비싼 모델을 감당할 수 없거나 필요로 하지 않는다는 점을 들었다. 오픈소스 AI 시스템은 소스 코드를 수정하고 개선할 수 있는 오픈 소스 소프트웨어와 같다. 01.AI는 AI 시스템의 매개변수 개수를 340억 개로 선택했다. 엄청나게 비싸지 않은 컴퓨터에서도 실행할 수 있도록 정교하게 계산한 결과다. 더 많은 개발자에게 어필하기 위해 60억개 매개변수 모델도 출시할 예정이다.

김희정 기자 dontsigh@mt.co.kr

Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?