'토큰 3조개' 익힌 텐센트 훈위안, 챗GPT보다 학습속도 빨라

정지은 2024. 4. 21. 19:16
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[레드테크의 역습]
中 내수용 넘어 글로벌 확장
인공지능 학습에 쓰이는 '토큰'
네이버가 5600억개 투입할 때
텐센트는 7개월새 1兆개 늘려
'中 카카오' 위챗 이용자 14억명
해외기업과 달리 방대한 데이터
기업AI·클라우드로 중남미·중동 등 공략
중국 광둥성 선전에서는 드론(왼쪽 첫 번째)이 커피를 배달하고, AI 로봇(두 번째)이 움직이는 광경을 볼 수 있었다. 손바닥만 대도 2초 만에 결제할 수 있는 첨단 페이(세 번째)도 체험했다. 선전=정지은/신정은 기자


3조 개. 중국 최대 정보기술(IT) 기업인 텐센트가 개발한 인공지능(AI) 대규모언어모델(LLM) 훈위안이 최근까지 학습한 토큰(말뭉치) 수다. 지난해 9월 첫 공개 때 밝힌 토큰 규모가 2조 개인 만큼 7개월 동안 50%나 늘린 셈이다. 네이버가 2021년 선보인 한국 최초 LLM이 5600억 토큰을 학습한 것을 감안하면 파격적인 수준이다. ‘챗GPT의 아버지’로 불리는 샘 올트먼의 오픈AI도 2020년 3000억 개의 토큰을 투입해 GPT3를 출범시켰고, 최근 들어서야 조 단위로 끌어올렸다.

텐센트의 빠른 추격에 세계 빅테크들이 경계의 목소리를 내는 이유가 여기에 있다.

 ‘토큰 경쟁’에서 가장 앞선 텐센트

텐센트가 AI에 대한 야심을 드러낸 건 2016년이다. 그해 4월 텐센트AI랩을 설립했다. 지난해 매출 6090억위안(약 115조원), 영업이익 1600억위안(약 30조원)을 거둔 ‘IT 공룡’은 위챗과 웨이신이라는 SNS로 축적한 데이터를 AI에 활용했다.

지난 18일 방문한 중국 광저우 위챗·웨이신 사무동에선 실시간 이용자 현황판에 ‘14억4700만 명’이란 수치가 빨간색으로 선명하게 찍혀 있었다. 이 중 중국인은 13억5900만 명. 거의 모든 중국인이 쓴다는 얘기다. 외국인 이용자도 1억 명에 육박했다.

텐센트 관계자는 “대다수 AI기업은 토큰에 쓸 데이터의 기근 현상을 겪고 있지만 텐센트는 걱정할 필요가 없다”고 말했다. 위챗이 은행 등 금융 거래는 물론 진료 예약, 처방전 발송, 식당 결제, 택시 콜, 공유자전거 이용 등 거의 모든 일상에 활용되는 ‘생활 리모컨’인 덕분에 AI 학습에 쓰이는 토큰을 대량 확보할 수 있어서다.

AI 성능을 개선하는 데 토큰은 가장 확실한 수단이다. 부족한 토큰으로 최첨단 AI칩을 사용하는 것보다 칩 성능은 떨어져도 엄청난 데이터를 학습하는 것이 낫다는 말이 나오는 이유다. 네이버 관계자는 “오프라인의 실시간 데이터를 대규모로 확보하는 곳은 중국 빅테크뿐”이라고 말했다.

 기업용 AI로 영역 확장 중

마화텅 텐센트 회장은 훈위안을 고도화하면서 기업AI로 생태계를 확장하고 있다. 그는 이달 초 임직원에게 보낸 메시지에서 “훈위안은 수치 추론, 논리적 추론, 다단계 대화 등에서 탁월한 성능을 발휘하는 최상위 모델”이라고 강조했다.

훈위안은 이미지 생성, 텍스트 인식, 카피라이팅 등 다양한 기능을 지원한다. SNS, 금융, 공공 서비스, 전자상거래, 물류 운송, 게임 등 주요 산업에서 활용도가 높다고 회사 측은 설명했다. 다우슨 퉁 텐센트 수석부사장은 “금융 교육 물류 게임 등 20개 산업군에 걸쳐 50여 개 솔루션을 보유한 기업용 훈위안 서비스를 중국 기업에 제공하고 있다”며 “각 기업에 최적화된 지능형 서비스를 선보일 것”이라고 말했다.

기업AI는 중국의 최대 약점으로 꼽히던 분야다. 소비 영역과 달리 중국 기업이 자체 축적한 ‘정형화된 데이터’가 부족해서다. 텐센트의 AI 클라우드로 주요 산업 데이터를 끌어모아 이런 약점을 극복하겠다는 게 마 회장의 전략이다. 구글, 아마존, 마이크로소프트가 주도하는 초거대 AI 생태계와는 완전히 다른 별개 ‘AI 행성’을 만들겠다는 얘기다.

17일 방문한 중국 선전 텐센트 본사에선 텐센트AI랩이 지난달 개발한 생성형 AI 게임엔진 지넥스를 설명하는데 공들였다. 생성형 AI를 활용해 콘텐츠 제작 시간을 줄이고 풍성한 게임 스토리를 만들 수 있는 획기적인 도구다. 텐센트는 훈위안의 기업AI를 자체 사업 및 서비스에 적용하고 있는데, 그 분야만 400개에 달한다.

 ‘알테쉬’처럼 AI로 해외 공략

텐센트는 AI 기술을 무기로 글로벌 영토를 더 넓힐 계획이다. 2016년 아시아 유럽 미국의 글로벌 파트너 네트워크를 구축한 것을 시작으로 해외에 발을 디딘 텐센트는 최근엔 중남미 중동에서 독자 생태계를 구축 중이다.

자오젠난 텐센트 클라우드인터내셔널 부사장은 “클라우드, AI, 빅데이터, 보안 등 주요 기술을 통합해 맞춤형 디지털 솔루션을 구축해주는 형태의 글로벌 사업을 키워나갈 것”이라고 말했다.

텐센트는 지난해 640억위안(약 12조원)을 연구개발(R&D)에 쏟아부었다. 역대 최대 규모다. 올해는 R&D 투자금에서 AI 관련 비중을 더 높일 것으로 알려졌다.

선전·광저우=정지은 기자 jeong@hankyung.com

Copyright © 한국경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?