中가성비 AI ‘키미 K2 싱킹’, 추론-검색능력 챗GPT 넘었다
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
중국 인공지능(AI) 스타트업 문샷AI의 오픈소스 대형언어모델(LLM) '키미 K2 싱킹'이 일부 성능 테스트에서 오픈AI의 '챗GPT 5.0'보다 앞서는 결과를 낸 것으로 나타났다.
김근교 NC AI 글로벌사업실장은 "HLE 테스트에서 도구 사용 기준 글로벌 프런티어 모델을 앞섰다는 건 '에이전틱 AI'로서 키미 K2 싱킹의 능력이 더 앞섰다고 볼 수 있는 것"이라며 "다만 벤치마크 점수가 실제 성능을 대변하진 않는다. 앞서 벤치마크 성능이 뛰어났음에도 사용성을 입증하지 못한 모델들이 다수였듯 키미 K2 싱킹이 점수만큼의 활용성을 보여줄지는 앞으로 지켜볼 필요가 있다"고 말했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
![키미 홈페이지 [kimi.com 홈페이지 캡처]](https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202511/17/donga/20251117164248645wyrp.jpg)
17일 정보기술(IT) 업계에 따르면 문샷AI는 6일 자사 홈페이지를 통해 키미 K2 싱킹을 공개했다. 7월 발표한 ‘키미 K2’에 이어 4개월 만에 개선된 버전을 내놓은 것이다. 국내 이용자들도 키미 사이트에 접속해 가입 절차를 거치면 키미 K2 싱킹을 써볼 수 있다. 직접 키미 K2 싱킹을 사용해 보니 한국어 질문에도 별다른 무리 없이 답변을 내놨다. 다만 답변을 내놓기까지 사고하는 시간이 타 모델에 비해 다소 길었다.
문샷AI 측에서 공개한 지표에 따르면 키미 K2 싱킹은 ‘HLE’ 테스트에서 도구 사용 기준 44.9점을 받았다. HLE는 추론·창의적 사고 능력을 평가하는 테스트로 AI가 가장 어려워하는 벤치마크 중 하나로 꼽힌다. 같은 테스트에서 챗GPT 5.0은 41.7점, 앤스로픽의 ‘클로드 소네트 4.5’는 32.0점, 딥시크의 ‘V3.2’ 모델은 20.3점을 받아 키미 K2 싱킹의 점수가 더 높았다.
키미 K2 싱킹은 웹 검색 능력을 평가하는 ‘브라우즈콤프’에서는 60.2점을 받았다. 이 또한 챗GPT 5.0(54.9점), 클로드 소네트 4.5(24.1점), 딥시크 V3.2(40.1점)를 앞서는 점수다. 다만 코딩 능력을 평가하는 ‘SWE’ 테스트에서는 챗GPT 5.0, 클로드 소네트 4.5를 넘어서지 못했다.
CNBC 등 외신에 따르면 키미 K2 싱킹의 훈련 비용은 460만 달러 수준인 것으로 전해졌다. 올 초 딥시크 측이 밝혔던 개발 비용 560만 달러(약 82억 원)보다 낮은 수준이다. 업계는 딥시크로 큰 주목을 받았던 중국산 ‘저비용·고효율’ 모델이 키미 K2 싱킹으로 재부상할 수 있다는 점에 주목하고 있다.
김근교 NC AI 글로벌사업실장은 “HLE 테스트에서 도구 사용 기준 글로벌 프런티어 모델을 앞섰다는 건 ‘에이전틱 AI’로서 키미 K2 싱킹의 능력이 더 앞섰다고 볼 수 있는 것”이라며 “다만 벤치마크 점수가 실제 성능을 대변하진 않는다. 앞서 벤치마크 성능이 뛰어났음에도 사용성을 입증하지 못한 모델들이 다수였듯 키미 K2 싱킹이 점수만큼의 활용성을 보여줄지는 앞으로 지켜볼 필요가 있다”고 말했다.
박종민 기자 blick@donga.com
Copyright © 동아일보. All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지
- 美항모, 베네수엘라 코앞 진입…“마두로는 테러조직 수장”
- 오세훈 때리는 김민석…종묘·한강버스 이어 광화문광장도 “이상하다”
- 제헌절, 18년만에 다시 공휴일 될듯…행안소위 개정안 의결
- 국힘 대변인 “김예지, 장애를 무기로 삼아” 막말…장동혁 “엄중 경고”
- “결혼이 페널티, 韓신혼부부 19% 위장 미혼”…日언론의 진단은?
- 나나에 맨손 제압된 30대 강도…“연예인 집인 줄 몰랐다”
- ‘남편이 국보법 실형’ 안다르 창업자 “결혼前 일이라 몰랐다”
- 유전자변형 감자 빗장 풀리나…美농산물 수입도 빨라질 듯
- 與, 권리당원 권한 강화…대의원과 동등한 1인 1표 행사
- ‘오키나와 영유권’으로 번지는 中-日 갈등