0.1달러 vs 3달러, 中 AI ‘토큰 덤핑’이 낳은 역설…싸질수록 무너진다

200여개 LLM 난립하며 출혈 경쟁
점유율 높이려 ‘박리다매’ 방식 채택
거대 자본 앞 스타트업 생존 어려워
쉽고 안전한 AI 에이전트 모델 집중
美·韓 기업 사용량 中 비중 상위권

0.10달러 vs 3달러.

중국 샤오미의 인공지능(AI) 모델 ‘미모’와 미국 오픈AI 최신 모델의 100만 토큰당 입력 단가다. 올해 기준으로 중국산 AI와 미국산 AI의 토큰 가격 차이는 극단적으로 벌어져 있다. 중국 내에만 200여 개의 대규모언어모델(LLM)이 가격 경쟁을 벌이는 사이 다른 나라와의 가격 격차는 더 커졌다.

미국 주요 빅테크의 최상위 모델과 중국의 주요 모델을 비교하면 적게는 30배에서 많게는 170배까지 차이가 난다. 오픈AI·앤스로픽 최신 모델은 100만 토큰당 입력 약 3달러(약 4400원), 출력 15달러(약 2만2000원)를 받는다. 반면 딥시크·큐웬 등 중국산은 입력 0.14달러(약 208원) 수준이다. 최근 공개된 샤오미의 ‘미모’는 0.10달러(약 148원)까지 떨어졌다. 방대한 내수 데이터와 오픈소스 기반 연구개발을 무기로 중국산 모델들이 초저가 공세를 퍼붓고 있기 때문이다.

중국산 토큰의 가격 경쟁이 시작된 것은 2024년 5월 ‘딥시크-V2’부터였다. 토큰 100만 개당 1위안(약 220원)씩 책정한 딥시크는 기존 GPT 대비 수십~수백 배가 저렴했다. 이후 바이두, 바이트댄스, 알리바바, 텐센트 등은 토큰 가격을 80~97% 내리거나 무료로 풀며 도미노 인하가 이어졌다.

이들이 초저가 전략을 무기로 삼은 것은 후발주자로서 글로벌 개발자 생태계를 빠르게 흡수하기 위해서다. 수익을 포기하더라도 오픈소스 및 저비용 응용프로그램인터페이스(API)를 제공해 시장 점유율을 늘리는 이른바 ‘박리다매’ 방식이다. 토큰 소비량이 막대한 ‘AI 에이전트’가 대중화되면서 저렴한 중국산 모델을 연동해 비용을 아끼려는 미국 및 글로벌 기업들의 수요를 폭발적으로 흡수하고 있다.

중국 정부의 전폭적인 보조금도 한몫했다. 미국 기업이 자체 자본으로 값비싼 전력과 인프라를 감당하는 반면, 중국은 AI 연산 능력(컴퓨팅 파워)을 국가 핵심 프로젝트로 지정해 막대한 보조금을 뿌렸다. 지방정부를 중심으로 AI 데이터센터의 전기요금을 크게 지원하며 화웨이나 캠브리콘 등 중국산 자체 AI 반도체를 사용할 경우 전력 비용의 절반(50%)을 정부가 대납해주는 식의 지원책을 펼치고 있어 본질적인 AI 운영 비용이 크게 낮아졌다.

특히 미국의 빅테크는 엔비디아의 최신 GPU를 싹쓸이하며 AI 데이터센터 구축에 천문학적인 자본을 쏟아부었다. 기업 입장에서는 막대한 인프라 투자 비용을 회수해야 하므로 프리미엄 모델의 API 토큰 가격을 일정 수준 이하로 내리기가 구조적으로 어렵다. 반면 중국은 가격을 무너뜨리는 데 집중하고 있어 양측의 비즈니스 모델 지향점이 완전히 다르다.

중국발 저가 공세는 유망 AI 스타트업을 직격하고 있다. 수익화를 시도하던 업체들도 가격을 끌어내릴 수밖에 없는 처지다. 스타트업들은 거대 자본을 앞세운 빅테크나 대기업과의 토큰 가격 경쟁에서 밀린다. △인프라 종속과 규모의 경제 한계 △빅테크의 공격적 가격 인하 △오픈소스로 인한 모델 자체 가치 무료화 △에이전트 AI 도입에 따른 토큰 사용량 폭발로 인한 원가 부담 고정 등이 한계점으로 거론된다.

‘락인 효과’를 꾀하기 위해 도입한 고정 구독 요금제가 오히려 수익 구조를 악화시키고 있다는 지적도 나온다. 대부분의 스타트업들은 안정적인 매출을 위해 월정액 무제한이나 고용량 구독 요금제를 도입한다. 그러나 소수의 ‘헤비유저’가 한 달에 수억 개의 토큰을 소비할 경우 수익 구조가 붕괴되는 부작용이 나타난다. 브랜드 충성도가 낮은 상황이라 종량제를 도입할 수도 없고, 빅테크 서비스와 달리 쉽게 과금 방식을 바꿀 수도 없다.

문제는 품질 저하다. 같은 돈으로 더 많은 트래픽을 돌리다 보니 정확도·일관성·속도·안정성이 모두 떨어졌다. 응답 지연과 끊김은 인터랙티브 제품에 치명적이다. 원가를 맞추려 분당 토큰(TPM)과 분당 요청(RPM), 동시 요청 수를 제한하자 출력 제한과 타임아웃이 늘었다.

전문가들은 토큰 저가 판매가 지속 가능한 모델이 아니라고 봤다. 리창 텐센트 부사장은 중국 경제 매체 제일재경과 인터뷰에서 “토큰을 자동차 연료에 비유한다면 ‘엔진(AI 모델 아키텍처)’의 효율은 외면한 채 연료 소비량에만 집중할 경우 결국 사용자 비용이 너무 커져 외면받는다”고 지적했다. ‘효율적인 엔진(고도화된 모델)’은 ‘적은 연료(토큰)’로 최상의 결과를 내지만, 최적화 없이 토큰 판매량에만 매달리는 것은 방향이 잘못다는 뜻이다.

리 부사장은 토큰 판매 사업 자체가 ‘점착성(Sticky)이 없는 비즈니스’라고 진단했다. 저가와 할인으로 고객을 끌어모아도 경쟁사가 더 싼 가격을 제시하면 곧바로 이탈한다는 것이다. 그는 “단순 토큰 판매보다 사용자가 쓰기 쉽고 안전한 AI 에이전트 솔루션 개발에 집중해야 한다”며 “단순 토큰 인프라 제공자가 아닌 AI 에이전트·클라우드 솔루션 공급자로 도약하는 것이 목표”라고 강조했다.

실제 텐센트는 자체 거대 모델 ‘훈위안(Hunyuan)’ 기반 ‘지능형 에이전트 개발 플랫폼’을 B2B 클라우드로 제공하고 있다. 기업 고객이 자사 데이터를 연동해 고객 서비스, 마케팅, 코딩 지원에 바로 쓸 수 있다. 14억 명이 쓰는 국민 메신 ‘위챗’ 생태계와도 결합해 토큰이 아닌 ‘업무 생산성과 부가가치’를 파는 방향으로 전환 중이다.

한편 미국·한국 기업 토큰 사용량에서 중국산 비중은 계속 높아지고 있다. 오픈라우터가 이번 주(5월 4~8일) 트래픽 기준으로 분석한 상위 10개 AI 모델 중 중국 모델은 5개였다. 텐센트의 ‘Hy.3’이 1주일간 3조7400억 토큰으로 1위에 올랐고 ‘문샷AI의 키미 K2.6(1조 7800억 개)’, ‘앤스로픽의 클로드 소빗 4.6(1조 3800억 개)’, ‘앤스로픽의 클로드 오퍼스 4.7(1조 500억 개)’이 뒤를 이었다.

박시진 기자 see1205@sedaily.com

서울경제

국제

0.1달러 vs 3달러, 中 AI ‘토큰 덤핑’이 낳은 역설…싸질수록 무너진다