오픈AI·구글·엔트로픽 잇단 가격 인상 AI 에이전트 확산에 토큰 소비 급증 전망 빅테크, GPU·AI 가속기 개발로 비용 절감 경쟁 "결국 AI 활용 효율이 기업 경쟁력 좌우"
순다르 피차이 구글·알파벳 최고경영자(CEO)가 19일(현지시간) 미국 캘리포니아주 마운틴뷰에서 열린 '구글 I/O 2026' 개발자회의에서 발언하고 있다. / 사진=뉴스1
기업의 인공지능(AI) 모델 사용료가 급증하면서 비용 절감이 최우선 과제로 떠올랐다. AI 도입 초기에는 각종 업무에 AI 모델을 적용하는 데 집중했다면, 이제 이용 효율을 높이고 비용을 절감하는 방향으로 전략의 중심이 이동하는 분위기다.
종량제 과금 체계가 확산되는 과정에서, AI 모델 이용료가 인건비에 근접한 수준까지 치솟을 것이란 전망도 나온다. 빅테크 기업들이 AI 추론에 특화된 인프라를 개발하며 비용 절감에 나서고 있지만, 실제 요금 인하로 이어질지는 미지수다.
27일 정보기술업계에 따르면, 토큰 비용이 증가하면서 AI 서비스를 도입한 기업들의 부담이 커지고 있다.
토큰(Token)은 AI가 글을 읽고 처리하는 최소 단위이자, 비용을 산정하는 기준이다. 비즈니스용 AI 모델의 경우, 명령어(프롬프트)가 길어지고, 수행 업무가 복잡해질수록 더 많은 토큰을 소비하게 된다. AI 모델 활용 기업은 이에 비례해 이용료를 부담해야 한다.
AI 비용 관리 및 거버넌스 플랫폼인 마브릭(Mavvrik)이 공개한 보고서에 따르면, 지난해 기업의 80%가 AI 인프라 비용 예측에서 25%가 넘는 오차를 보였으며, 84%는 AI 업무 증가로 매출총이익률이 크게 하락했다.
김동훈 NHN클라우드 대표이사는 지난 26일 신제품 출시 기자간담회에서 "이제 토큰을 얼마나 저렴하게 생산하고 활용하느냐가 중요한 시대"라며 "다시 말해 AI 인프라를 얼마나 단단하고 효율적으로 운영하는지 여부가 AI 성패를 좌우할 것"이라고 강조하기도 했다.
글로벌 빅테크들은 토큰 가격을 올리는 추세다. 한층 고도화된 AI 모델을 출시하면서 수익 실현에 나선 것으로 풀이된다. 빅테크 기업들은 그동안 차입한 자금으로 GPU와 AI 반도체, 데이터센터 등 인프라 환경을 구축해왔다.
이용자 수가 일정 수준에 도달하자, 비로소 '제 값 받기'에 들어간 것이란 시각도 있다.
샘 올트먼(Sam Altman) 오픈 AI CEO / 사진=뉴스1
'챗GPT 열풍'을 이끈 오픈AI는 지난달 'GPT-5.5'를 출시하면서 토큰 가격을 두 배로 인상했다. 100만 토큰 입력 기준으로 5달러, 캐시된 입력(자주한 질문)은 0.5달러, 출력은 30달러로 책정했다.
엔트로픽은 지난달 월 20달러 정액 요금제에서 코딩 에이전트인 '클로드 코드'를 제외했다. '클로드 코드'를 쓰려면 월 100달러의 맥스 5배(Max 5x) 이상의 요금제를 선택해야 한다.
구글도 이 흐름에 편승했다. 구글이 지난 3월에 출시한 '제미나이 플래시 3.5'는 '제미나이 3.1 플래시라이트'와 '제미니 3 플래시프리뷰'보다 3배~6배 비싸다.
토큰 비용이 늘어나긴 했지만, 인건비와는 비교할 수 없을 만큼 저렴하다. 업계에선 빅테크 기업들이 본격적인 수익화에 나서면서, 토큰 비용이 인건비에 조금 밑도는 수준까지 오를 것으로 보고 있다.
각종 복리후생과 보험까지 적용한 직원의 시간 당 인건비가 40달러라면, 오픈AI, 구글, 엔트로픽은 시간 당 30달러 수준의 AI 서비스를 내놓을 것이란 뜻이다.
이성엽 고려대 기술경영전문대학교 교수는 "현재 GPU 자원이나 전력 부분에서 비용이 많이 들기 때문에 토큰 같은 종량제로 하지 않으면 운영 자체가 어렵다"며 "(빅테크 들은) 대부분 투자 받아서 그 비용 문제를 해결하고 있는데 서비스가 안정화 단계에 들어서고 나면 결국 종량제 방식으로 가야 할 것"이라고 말했다.
AI 에이전트가 확산되는 만큼 토큰 비용은 증가할 전망이다. 특히 스테이블 코인이 제도권 금융 안으로 편입되고 실제 상거래에 활용될 경우, 에이전트와 에이전트 간 소통이 늘면서 토큰 소비량이 기하급수적으로 증가할 수 있다.
예컨대 장소 검색과 호텔 예약, 항공권 구매, 자동차 렌트 등을 실시간으로 처리하며 초 당 수백만 단어의 대화를 주고받는 것도 가능하다.
'AI 붐'을 주도했던 기업들은 최근 AI 모델을 더 효율적으로 처리할 수 있는 하드웨어를 개발 중이다.
엔비디아를 필두로, AMD, AWS, 인텔, 구글 등 대부분의 기업이 토큰 당 비용을 낮추기 위해 GPU, AI 가속기, 시스템 등 AI 인프라 전반을 재설계하고 있다.
다만, 이러한 기술 혁신이 실제 서비스 요금 인하로 이어질지는 미지수다. 업계에선 AI 서비스 수요가 높아지고 있는 만큼, 당분간 비용 확대가 불가피할 것이란 의견이 힘이 실리는 분위기다.
전문가들은 '값비싼' AI 모델을 적재적소에 활용하며 생산성을 높이는 전략이 선행돼야 한다고 지적한다.
이성엽 교수는 "토큰을 사용해 고가 요금제로 가게 되는 경우, AI 사용을 통해 그 이상의 부가가치를 만들어야 한다"며 "생산성을 늘리면 비용이 어느 정도 상쇄되기 때문에 AI 모델을 효율적으로 사용하는 방안들, 나중에 생산성이나 이익 측면에서 도움이 되도록 사용하는 효율적인 사용 법에 대한 고민이 필요하다"고 말했다.