GPT보다 싸다던 클로드, 총비용 30% 더 높아
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
앤트로픽이 오픈AI보다 40% 낮은 모델 사용료를 책정했지만 전체 비용은 더 높은 것으로 나타났다.
4일 벤처비트 등에 따르면 동일한 문장에 대해 앤트로픽의 '클로드 3.5 소네트'이 생성하는 토큰 수가 GPT-4o보다 더 많아 약 20~30% 더 높은 사용 비용이 드는 것으로 나타났다.
클로드 3.5 소네트가 GPT-4o보다 입력 토큰 단가는 40% 저렴하지만 토크나이저 비효율성 때문에 전체적으로 비용이 더 든다는 것이다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
(지디넷코리아=김미정 기자)앤트로픽이 오픈AI보다 40% 낮은 모델 사용료를 책정했지만 전체 비용은 더 높은 것으로 나타났다. 기업이 인공지능(AI) 모델 도입 시 '숨겨진 비용'을 고려해야 한다는 지적이다.
4일 벤처비트 등에 따르면 동일한 문장에 대해 앤트로픽의 '클로드 3.5 소네트'이 생성하는 토큰 수가 GPT-4o보다 더 많아 약 20~30% 더 높은 사용 비용이 드는 것으로 나타났다.
토큰은 사람이 쓴 문장을 AI가 이해할 수 있는 단위다. AI는 토크나이저라는 도구를 활용해 사람의 문장을 파악한다.
클로드 3.5 소네트가 GPT-4o보다 입력 토큰 단가는 40% 저렴하지만 토크나이저 비효율성 때문에 전체적으로 비용이 더 든다는 것이다.
즉, 앤트로픽이 토크나이저 비효율성이 오픈AI보다 큰 것이다. 클로드의 토크나이저는 오픈AI의 토크나이저보다 문장을 더 작게 나눠 더 많은 토큰을 만드는 셈이다.

예를 들어 '안녕하세요 여러분'이라는 문장을 GPT의 토크나이저는 2개 토큰으로, 클로드의 토크나이저는 4개 토큰으로 나눌 수 있다. 어떤 토크나이저를 활용하느냐에 따라 같은 문장이 더 많이 쪼개질 수 있으며 그만큼 비용 차이도 크다.
기술적이거나 구조화된 문장일수록 두 모델 토큰 수 차이는 더 벌어진 것으로 나타났다. 일반 영어 기사에서는 클로드가 GPT보다 약 16% 더 많은 토큰을 생성했고, 수학 공식은 21%, 파이썬 코드는 30%나 많았다.
입력 토큰 수가 많아지면 비용이 늘어날 뿐 아니라 한 번에 처리할 수 있는 정보 양도 줄어든다. 이에 클로드는 최대 20만 토큰을 지원하지만, 토큰이 많이 쪼개지는 특성 때문에 GPT가 제공하는 12만8천 토큰보다 덜 효율적일 수 있다는 해석도 나왔다.
외신은 앤트로픽이 비공개 형태 토크나이저를 활용한다는 점도 지적했다. 오픈AI는 BPE 방식의 오픈소스 토크나이저를 사용해 작동 방식이 공개돼 있다. 반면 앤트로픽은 6만5천 개 토큰만을 쓰는 자체 토크나이저를 활용하고 있다. 해당 코트나이저의 세부 구조는 외부에 공개되지 않았다.
벤처비트는 "AI 기업들이 토크나이저 동작 원리를 정확히 파악하지 못하면 AI 모델 예산을 예측하거나 사전 견적을 내기 어렵다"며 "대규모 API 사용이 필요한 기업일수록 이 변수는 중요한 비용 리스크가 될 것"이라고 지적했다.
김미정 기자(notyetkim@zdnet.co.kr)
Copyright © 지디넷코리아. 무단전재 및 재배포 금지.
- "AI, 스스로 보호하려 들 수 있다"…앤트로픽, '모델 복지' 기준 실험 착수
- 앤트로픽 CISO "내년 AI 직원 도입 활발…보안 재설계 필수"
- 오픈AI 이어 구글도 앤트로픽 기술 'MCP' 채택…AI 에이전트 강화 행보
- [황승진의 AI칼럼] 강화학습과 최적화
- 반도체특별법 국회 본회의 통과…'R&D 주52시간 예외'는 빠져
- 삼성전자 "올해 HBM 매출 전년比 3배 목표"…출하량 100억Gb 넘을 듯
- [현장] "2026년 AI·SW 강국 도약"…정부·국회·산업계 의지 결집
- 휴머노이드가 의류 포장…사람 공정에 그대로
- 현대차·기아, 올해 수익성 방어 시험대…관세 7.2조원 해결책은
- '사법 리스크' 벗어던진 함영주…"생산적 금융에 역량 집중"