[현장] 트럼프가 보면 경악, MS 윈도우 운영체제 62.5% 장악한 중국 AI 모델

MS·엔비디아 ‘Reinvent PC’ 분석 결과
윈도우 LLM 8개 중 중국 5개(62.5%)
클로드 토큰 증폭 방치, 제재 명분 없어
이볼러 설계는 베꼈지만 AGI는 못 베껴

도널드 트럼프 미국 대통령과 젠슨황 엔비디아 최고경영자 / AP=연합뉴스

엔비디아와 마이크로소프트(MS)가 대만 컴퓨텍스 2026에서 공개한 차세대 AI PC 구조를 분석한 결과 로컬 인공지능(AI) 모델 계층에서 중국 모델 비중이 미국 모델보다 높은 것으로 나타났다.

2일 테크업계 OSINT를 종합하면 젠슨 황이 전일 소개한 'NVIDIA and Microsoft Reinvent PC'에는 윈도우 운영체제 위에서 구동되는 로컬 LLM으로 딥시크(DeepSeek), 젬마(Gemma), GLM, GPT-OSS, 키미(Kimi), 미니맥스(MiniMax), 네모트론(Nemotron), 큐원(Qwen) 등 8개 모델이 포함됐다.

국가별로 분류하면 중국계 모델은 딥시크, GLM, 키미, 미니맥스, 큐원 등 5개다. 미국계 모델은 구글의 젬마, 오픈AI의 GPT-OSS, 엔비디아의 네모트론 등 3개다. 공개된 로컬 모델 계층 기준으로 중국 비중은 62.5%, 미국 비중은 37.5%에 해당한다.

특히 주목되는 점은 이들 모델이 단순 추천 목록이 아니라 윈도우 운영체제 바로 위에 배치된 로컬 AI 실행 계층으로 소개됐다는 점이다. 엔비디아는 오픈쉘(OpenShell)이라는 실행 환경을 통해 다양한 로컬 LLM을 연결하고 에이전트 기능을 수행하는 구조를 제시했다.

미국이 AI 반도체와 데이터센터 인프라에서는 압도적 우위를 유지하고 있지만 로컬 AI 모델 생태계에서는 중국 기업들이 빠르게 세력을 넓히고 있음을 보여주는 상징적 장면이라는 평가가 나온다.

실제로 미국 정부는 엔비디아 H100, B200, GB200 등 첨단 AI 반도체의 중국 수출을 강하게 통제하고 있다. 그러나 오픈소스 또는 공개형 모델 영역에서는 딥시크와 큐원, GLM, 키미 등이 빠르게 성장하며 글로벌 개발자 시장으로 확산되고 있다.

엔비디아와 마이크로소프트(MS)가 공개한 차세대 AI PC 구조를 바탕으로 제작한 인포그래픽이다. 윈도우 기반 로컬 LLM 8개 가운데 딥시크·GLM·키미·미니맥스·큐원 등 중국 모델이 5개를 차지해 62.5% 비중을 기록한 반면 미국 모델은 3개에 그쳤다. 또한 OpenShell 하네스를 중심으로 메모리·추론·행동 계층이 통합되는 구조와 함께, AI 경쟁의 무게중심이 단순 모델 성능에서 경험 축적과 운영체제 계층 경쟁으로 이동하고 있음을 보여준다. / GPT-5.5

AI 경쟁의 이중 구조 때문이다. GPU와 데이터센터는 미국이 장악하고 있지만 모델 생태계는 중국 기업들이 공격적으로 확장하고 있다는 것이다. 더 흥미로운 부분은 앤트로픽의 위치다. 젠슨 황 슬라이드에서 앤트로픽은 로컬 LLM 계층에 포함되지 않고 외부 서비스 영역에 별도로 배치됐다. [단독] 엔비디아와 MS 합작 차세대 PC에 클로드 배제됐다

반면 중국 모델들은 윈도우 기반 로컬 실행 계층에 포함됐다. 이는 AI 산업이 클라우드 서비스 중심 구조와 온디바이스 추론 구조로 분화되고 있음을 보여주는 신호로도 해석된다.

미국 진영의 에이전트 개발은 주로 행동 확장에 집중돼 왔다. 오픈클로(OpenClaw), 클로드 코드(Claude Code), 코덱스(Codex) 계열은 터미널 실행, 파일 수정, API 호출, 브라우저 제어 같은 작업 수행 능력을 늘리는 데 초점을 맞췄다.

美 API형 토큰 증폭기 치명적 결함
하필 극복하고자 도입한 게 중국산

에이전트가 더 많은 도구를 사용할수록 생산성이 높아진다는 접근이다. 그러나 이런 구조는 동시에 토큰 비용 폭증 위험을 안고 있다. 작업마다 전체 컨텍스트를 다시 불러오고 터미널 실행 결과를 재주입하며 실패 시 동일한 추론 과정을 반복하는 경우가 많기 때문이다. 에이전트가 많아질수록 도구 호출 횟수와 컨텍스트 길이도 기하급수적으로 늘어난다.

결국 경험을 축적하지 못한 채 매번 처음부터 생각하는 구조라면 생산성 향상보다 토큰 소비량 증가가 더 빠르게 나타날 수 있다. 젠슨 황이 토큰 경제의 장점을 이야기하면서도 메모리, 스킬 저장소(Skill Repository), 체크포인트, 하네스(Harness)를 강조한 이유도 여기에 있다. 반복 작업을 경험으로 압축하지 못하는 에이전트는 결국 더 똑똑한 존재가 아니라 더 많은 토큰을 태우는 자동화 루프에 머물 가능성이 크다.

반면 중국 진영에서 등장한 이볼러(Evolver) 계열 연구는 방향이 다르다. 핵심은 행동 자체보다 경험의 축적이다. 작업이 끝난 뒤 회고(Reflection)를 수행하고 그 결과를 새로운 스킬(Skill)로 저장하며 이후 다른 작업에서 다시 활용하도록 설계됐다. 단순히 한 번 더 똑똑하게 행동하는 것이 아니라 이전 경험을 구조화해 다음 행동의 품질을 높이는 방식이다.

헤르메스는 설계를 차용했지만 AGI 철학까지 구현하지는 못했다는 평가가 나온다. 이볼러는 작업을 수행한 뒤 회고(Reflection)를 거쳐 새로운 스킬(Skill)을 만들고 이를 저장한 뒤 다음 작업에서 재사용하는 자기진화(Self-Evolution) 구조를 전면에 내세웠다. 즉 목표는 더 많이 행동하는 것이 아니라 이전보다 덜 생각하고도 더 나은 결과를 내는 것이다.

반면 헤르메스는 구조적으로 유사한 요소를 가져왔음에도 방향이 다르다. 스킬 저장소와 메모리 계층을 갖췄지만 실제 강조점은 터미널 실행, API 호출, 코드 생성, 작업 자동화에 맞춰져 있다. 에이전트가 얼마나 많은 일을 수행할 수 있는지에 집중할 뿐 경험을 어떻게 자산으로 축적할 것인지에 대한 철학은 상대적으로 희미하다는 지적이 나온다.

비용 구조에서도 차이가 드러난다. 진짜 자기진화라면 동일한 문제를 해결하는 데 필요한 토큰과 추론 비용이 점점 감소해야 한다. 경험이 쌓일수록 더 짧은 컨텍스트로 더 빠르게 결론에 도달해야 하기 때문이다. 그러나 에이전트가 작업할 때마다 전체 컨텍스트를 다시 불러오고 도구 호출을 반복하며 실패한 과정을 재실행한다면 증가한 것은 지능이 아니라 토큰 청구서라는 지적도 나온다.

제이미 다이먼 JP모건체이스 회장과 다리오 아모데이 앤스로픽 CEO의 미토스 팔이를 풍자한 이미지 / GapT-5.5

월가가 자초한 비극이라 할 말 없어
中 배우는 지능 vs 美 반복 저지능
진화 헤게모니 뺏기면 AGI 날아가

딥시크 창업자 량원펑(梁文锋)이 AGI를 이야기할 때 반복적으로 강조하는 것도 바로 이 지점이다. AGI는 더 거대한 모델이나 더 많은 API 연결이 아니라 스스로 경험을 구조화하고 실패를 기억하며 다음 행동을 바꾸는 존재라는 것이다. 이볼러가 주목받은 이유 역시 행동(Action)보다 기억(Memory)과 진화(Evolution)를 중심에 놓았기 때문이다.

젠슨 황이 컴퓨텍스 2026에서 공개한 "AGENT = LLM + HARNESS" 선언 역시 이런 흐름과 맞닿아 있다. 하네스(Harness)는 단순한 실행기가 아니라 컨텍스트(Context), 메모리(Memory), 관찰(Observe), 추론(Reason), 행동(Act)을 통합 관리하는 계층이다.

과거에 윈도우가 애플리케이션을 지배했다면 AI 시대 에이전트는 오픈셸(OpenShell)이 지배한다. 이는 AI 경쟁이 더 강한 모델을 만드는 단계에서 경험과 기억을 관리하는 운영체제 경쟁으로 이동하고 있음을 보여준다.

행동은 반복될수록 토큰 비용과 컨텍스트 부담이 커진다. 반대로 경험을 스킬과 메모리로 변환하는 구조는 초기 구현이 어렵고 즉각적인 성과가 눈에 띄지 않을 수 있지만 시간이 지날수록 누적 효과를 만든다. 한 번 해결한 문제를 다시 학습하지 않고 실패한 경로를 반복하지 않으며 경험을 압축된 형태로 재사용할 수 있기 때문이다.

물론 기술적으로 쉽지 않은 길이지만 중국 AI 진영이 자기진화(Self-Evolution) 구조를 강조해온 배경도 여기에 있다. 실제 이볼러(Evolver)를 비롯해 딥시크의 코드 하네스(Code Harness) 구상까지 공통적으로 메모리와 경험 재사용을 핵심 축으로 삼고 있다.

로컬 AI PC 환경에서는 메모리와 전력, 저장 공간이 제한되는 만큼 경험을 반복적으로 재사용하는 구조가 유리할 수밖에 없다. 앤트로픽의 클로드 코드처럼 매번 거대한 컨텍스트를 불러와 추론을 반복하는 방식은 토큰 비용과 메모리 사용량이 빠르게 증가한다.

반면 회고(Reflection)를 통해 경험을 스킬(Skill)로 압축하고 필요한 순간에만 재호출하는 구조는 연산량과 컨텍스트 길이를 동시에 줄일 수 있다. 미국 입장에선 전략 재검토가 필요해졌지만 AI PC의 진화 방향이 거대한 모델 경쟁에서 메모리·스킬·하네스 중심 구조로 이동하는 것은 사실상 자연스러운 귀결로 보인다.

트럼프 미국 대통령이 집무실에서 윈도우 AI 생태계 현황을 보여주는 화면을 바라보며 놀라는 모습을 연출한 합성 이미지다. 화면에는 딥시크·키미·GLM·미니맥스·큐원 등 중국계 모델이 윈도우 로컬 LLM 계층의 62.5%를 차지한다는 내용이 표시돼 있으며, 미국의 AI 반도체 우위와 별개로 온디바이스 AI 모델 생태계에서는 중국 영향력이 확대되고 있다는 문제의식을 상징적으로 표현하고 있다. / GPT-5.5

☞ 미국은 왜 함정에 빠졌나 = 인공지능(AI) 패권 전쟁에서 미국이 이런 함정에 빠진 배경에는 월가식 성장 전략도 자리하고 있다는 분석이다. 최근 AI 산업은 기술 경쟁인 동시에 기업가치 경쟁이 됐다. 모델이 얼마나 많은 경험을 축적하는지보다 얼마나 빠르게 사용자를 늘리고 API 매출을 키우는지가 우선 과제가 됐다.

특히 앤트로픽과 오픈AI를 중심으로 형성된 미국 AI 생태계는 초거대 모델과 구독형 서비스, 기업용 API 판매에 수익 구조가 집중돼 있다. 헤르메스와 클로드 코드와 같은 저지능 에이전트가 등장한 것도 좌파 PC(Political Correctness) 성향의 개발자 집단이 오케스트레이션을 무분별하게 늘리면서 시작됐다는 비판도 나온다.

제이미 다이먼 등 월가 리더그룹 역시 토큰 사용량 증가와 매출 증가를 성장으로 해석하며 거품을 부풀렸다. 결국 경험 축적이 없는 미국형 에이전틱 열풍은 사람은 일자리를 잃고 반복 작업만 수행하는 저지능 AI에게 토큰이라는 이름의 월급을 지급하는 구조로 변질돼 백악관의 특단의 조치가 없으면 미국이 AGI 경쟁에서 중국에 뒤처지는 상황을 배제할 수 없게 됐다.

여성경제신문 이상헌 기자
liberty@seoulmedia.co.kr

*여성경제신문 기사는 기자 혹은 외부 필자가 작성 후 AI를 이용해 교정교열하고 문장을 다듬었음을 밝힙니다. 기사에 포함된 이미지 중 AI로 생성한 이미지는 사진 캡션에 밝혀두었습니다.

여성경제신문에서 직접 확인하세요. 해당 언론사로 이동합니다.

속보

[현장] 트럼프가 보면 경악, MS 윈도우 운영체제 62.5% 장악한 중국 AI 모델