[분석] "결국 선택은 가성비 AI"···멀티 모델 시대, 중국이 웃는 이유
전력이 kWh로 측정되듯 토큰 단위로 과금
단순 반복은 저렴하게, 핵심만 고성능으로
中 '토큰 경제'를 新 AI 산업 전략으로 강조

인공지능(AI)을 업무에 활용하는 직군이 증가하면서 '토큰(Token)' 단위로 사용량을 계량·과금하는 구조가 빠르게 확산되고 있다. 성능 경쟁을 넘어 '얼마나 많이, 얼마나 효율적으로 호출하느냐'가 핵심 변수로 떠오르며 AI 활용 방식 자체에 변화가 나타나는 흐름이다.
10일 여성경제신문 취재를 종합하면 중국 국가데이터국은 올해 3월 중국 AI 생태계 내에서 발생한 일평균 토큰 호출량이 140조 개를 돌파했다고 밝혔다. 이는 2024년 초 약 1000억 개 수준과 비교하면 약 2년 만에 1000배 이상 증가한 수치다.
류례훙 국가데이터국 국장 겸 국가발전개혁위원회 부주임은 "일부 AI 모델 기업의 경우 1월 말 이후 20일간 매출이 지난해 총매출액을 넘어섰다"며 "토큰 요금을 기반으로 한 새로운 사업 논리가 빠르게 발전하고 있음을 보여준다"고 말했다. 이어 "데이터 공급과 가치 창출이 맞물리는 선순환 구조의 초기 단계"라고 평가했다.
글로벌 조사 기관인 오픈라우터(OpenRouter) 집계에서도 유사한 흐름이 관측된다. 지난 2월 기준 딥시크, 미니맥스 등 중국 AI 모델의 토큰 사용량이 미국 모델을 추월한 것으로 나타났다. 중국 내수 시장이 아닌 해외 개발자 생태계에서도 중국 모델 활용이 확대되고 있음을 보여주는 대목이다.

토큰은 대형언어모델(LLM)이 텍스트를 처리하는 최소 단위로 쉽게 말해 AI 사용량을 나타내는 지표다. 사용자가 질문을 입력하면 모델은 이를 개별 토큰으로 분해해 처리하고 생성된 답변 역시 토큰 형태로 구성된다.
이때 입력과 출력에 사용된 토큰 총량이 곧 연산량으로 이어진다. 구조는 단순하다. 일반 사용자가 월 구독료를 내고 제한된 범위 내에서 사용하는 방식이 '뷔페'라면 개발자가 API를 통해 AI를 호출하는 방식은 '먹은 만큼 계산하는 식당'에 가깝다. 호출이 늘어날수록 토큰 소모와 비용도 함께 증가하는 구조다.
'츠위안' 등장···토큰을 '화폐'로 본 중국
과거 AI 산업은 모델 성능 경쟁이 중심이었지만 수익 구조는 상대적으로 불명확했다. 반면 토큰은 호출 규모가 곧 연산량이자 비용, 그리고 매출로 연결되는 구조를 형성한다는 점에서 상업화의 접점으로 작용하고 있다.
황산 레노버 중국 인프라사업부 전략책임자는 "대형 모델이 생성하는 지능은 전력에 비유할 수 있다"며 "전력이 kWh로 측정되듯 AI는 토큰 단위로 과금된다"고 설명했다. 이어 "향후 인공지능은 물이나 전기처럼 필요한 만큼 사용하고 비용을 지불하는 기반 자원이 될 가능성이 있다"고 전망했다.
중국은 이러한 흐름에 맞춰 '토큰 경제' 개념을 산업 정책과 결합해 확장하고 있다. 중국 당국이 토큰의 중국식 표현으로 '츠위안(词元)'이라는 용어를 제시한 점도 같은 맥락이다. 최소 언어 단위인 '츠(词)'와 화폐 단위 '위안(元)'을 결합한 명칭으로 토큰을 단순 기술 개념이 아닌 '거래 가능한 경제 단위'로 인식하고 있음을 보여준다.
비용이 전략 된다···"싼 모델 80%, 비싼 모델 20%"
현장에서는 단일 모델이 아닌 여러 모델을 조합해 사용하는 '멀티 모델 구조'가 보편화되고 있다. 크롤링, 코드 초안, 단순 로직 등 반복 작업은 비용 효율이 높은 모델로 처리하고 시스템 설계·디버깅·보안 등 고난도 작업은 클로드(Claude), GPT 5.2 등 고성능 모델을 사용하는 방식이다.
실제로 중국 AI 모델의 가격 경쟁력은 압도적이다. 미니맥스, 문샷AI 등은 100만 토큰 당 2~3달러 수준의 요금을 책정한 반면 앤트로픽의 클로드는 약 15달러 수준으로 알려졌다. 단순 비교만으로도 중국 AI 모델이 미국 대비 80% 가량 저렴한 셈이다.
개발자 A씨는 본지에 "최근에는 하나의 모델에 의존하기보다 작업을 나눠 여러 모델을 조합하는 방식이 일반적"이라며 "고성능 모델에 모든 작업을 맡기면 토큰 소모가 급증해 비용 부담이 커지기 때문에 단순 작업은 비용 효율이 높은 모델로 분리해 처리한다"고 말했다.
이어 "특히 딥시크 같은 모델은 가격 대비 성능이 높아 단순 작업뿐 아니라 수학·코딩 영역에서도 활용도가 크다"며 "기존 경량 모델 대비 성능 차이가 뚜렷하고 일부 코딩·추론 작업에서는 GPT-3.5를 상회하는 수준"이라고 평가했다.

이처럼 비용 최적화를 중심으로 한 사용자 전략이 '멀티 모델 구조' 확산으로 이어지면서 중국에는 새로운 기회 요인으로 작용하는 모습이다. 중국이 '토큰 경제'를 산업 전략으로 강조하는 것도 이러한 흐름과 맞닿아 있다.
중국의 토큰 공개 방식은 사용량 자체를 산업 지표로 끌어올리는 데 초점이 맞춰져 있다. 호출량·증가율 같은 총량 데이터를 전면에 내세우면서 시장의 크기와 성장 속도를 '가시화'하고 이를 기반으로 개발자와 기업의 참여를 유도하는 구조다.
토큰은 단순한 기술 단위를 넘어 거래·과금·수요를 동시에 드러내는 계량 지표로 기능하며 정책·투자·생태계 확장을 하나의 흐름으로 묶는다. 결과적으로 사용량 공개는 투명성을 넘어 시장을 빠르게 확장시키기 위한 전략으로 해석된다.
반면 오픈AI를 비롯한 미국식 접근은 과금 체계만 명확히 드러내고 총 사용량이나 내부 연산 구조는 제한적으로 관리한다. 토큰은 외부에 보이는 가격 단위로 기능하지만 실제 비용과 효율을 결정하는 모델 구조·캐시·최적화 방식은 블랙박스로 남는다. 같은 토큰 단위라도 실제 연산 비용이 다를 수 있는 만큼 공개 범위를 최소화해 경쟁 우위를 유지하려는 접근인 것이다.
업계에서는 중국 모델의 토큰 기반 사용이 해외로 확산되는 흐름이 이어질 것으로 보고 있다. 루징 저장대 경제학과 교수는 "대형 모델 기업 입장에서 해외 사용자의 확대는 소비 패턴 형성과 동시에 모델의 빠른 반복 개선을 가능하게 한다"며 "토큰 경제가 아직 완전한 수익 모델로 정착되지는 않았지만 글로벌 사용자 확대는 향후 수익 기반 확장으로 이어질 것"이라고 전망했다.
☞ 멀티 모델 구조 = 하나의 AI 모델이 아니라 여러 모델을 작업별로 나눠 사용하는 방식. 비용과 성능을 동시에 최적화하기 위한 전략이다.
☞ API 호출 = 외부 프로그램이 AI 모델에 요청을 보내 기능을 사용하는 방식. 호출 횟수와 토큰 사용량에 따라 비용이 발생한다.
☞ 토큰 경제(Token Economy) = AI 사용량을 토큰 단위로 계량하고 이를 기반으로 과금·거래가 이루어지는 구조. AI를 '사용한 만큼 비용을 지불하는 자원'으로 보는 개념이다.
여성경제신문 김성하 기자
lysf@seoulmedia.co.kr
*여성경제신문 기사는 기자 혹은 외부 필자가 작성 후 AI를 이용해 교정교열하고 문장을 다듬었음을 밝힙니다. 기사에 포함된 이미지 중 AI로 생성한 이미지는 사진 캡션에 밝혀두었습니다.