[하정우의 AI 대혁명] 육수는 무료지만, 레시피는 비밀… 中 딥시크는 왜 오픈소스로 공개했나

하정우 네이버클라우드 센터장·과실연 공동대표 2025. 4. 23. 00:10
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

글로벌 AI 전쟁, 승부처는 누구나 자유롭게 쓸 수 있는 오픈소스
공짜 AI 뒤엔 판 키우기 전략… 결국 AI 생태계 지배하려는 속셈
“남이 끓여준 육수 얻어먹다 값 올리면 끝” AI 주권 전략 시급
그래픽=이철원

오픈소스 인공지능(AI)은 AI 시대의 핵심 개념이라 해도 과언이 아니다. 최근 중국 ‘딥시크’가 전 세계를 놀라게 한 것도 오픈소스 AI라는 점 때문이다. 오픈AI의 챗GPT나 구글의 제미나이와 달리, 페이스북을 운영하는 메타와 중국의 딥시크를 비롯한 AI 기업들은 오픈소스 AI 전략을 전면에 내세우고 있다.

오픈소스가 무엇인지 살펴보자. 오픈소스는 개발자들이라면 누구나 자유롭게 코드를 보고, 쓰고, 고치고, 나눌 수 있도록 공개하는 것을 뜻한다. 예를 들어 누군가 더하기, 빼기만 가능한 계산기 프로그램 코드를 공개하면 다른 사람이 그 코드를 받아서 곱하기 기능을 추가한 코드를 다시 공개하는 식이다. 전 세계 사람들이 달려들어 개선하고 공개하니 오픈소스 프로젝트는 발전 속도가 빠르다.

그래픽=이철원

누구나 가져다가 활용할 수 있도록 공개해 놓은 AI를 ‘오픈소스 AI’라고 한다. 그런데 오픈소스 AI는 기존 소프트웨어 오픈소스와 달리 완전한 공개가 아니다. 오픈소스의 필수 조건은 재현성, 즉 누구나 공개된 코드로 동일한 프로그램을 만들 수 있어야 한다. 그러나 대부분 오픈소스 생성형 AI는 재현이 불가능하다. AI를 재현하려면 AI 학습 코드와 학습 데이터가 함께 공개되어야 하는데 이들을 공개하지 않는다. 다만 학습 완료된 AI 모델과 모델 활용에 필요한 코드, 기술 문서만 공개할 뿐이다.

그래서 공개된 AI를 활용은 할 수 있지만 똑같이 만들어 낼 수는 없다. 생성형 AI를 공개하는 것은 잘 끓인 육수를 제공하는 것에 비유할 수 있다. 물론 육수 끓이는 비법은 공개하지 않는다. 메타의 라마, 딥시크 등 대부분 오픈소스 생성형 AI가 이런 형태다.

이런 한계에도 불구하고 오픈소스 AI가 AI 생태계 발전에 기여하는 바는 매우 크다. 생성형 AI를 만들려면 학습 데이터, 컴퓨팅 인프라, 인재 등을 고려할 때 적어도 수백억 원, 많게는 수조 원 규모의 꾸준한 투자가 필수적이다. 그런데 이러한 AI가 무료로 공개되니, 누구나 공개된 AI를 활용해서 천문학적 투자 없이도 혁신적인 서비스나 사업 기회를 만들 수 있다. 육수를 직접 끓이지 않고 공개된 육수를 재료로 수십 가지 요리를 만들 수 있는 것과 같은 이치다.

기업이 만든 AI 서비스는 완성된 요리, 보유한 데이터는 요리 재료로 이해하면 쉽다. AI 활용 라이선스 정책에 따라 상업적으로 쓸 때는 비용을 지불해야 할 수도 있지만, 직접 AI 학습에 필요한 비용에 비할 바는 아니다.

그럼 미국이나 중국의 AI 기업들은 도대체 왜 천문학적인 투자의 산물인 AI를 오픈소스로 공개하는 걸까? 그것이 중장기적으로 훨씬 이익이기 때문이다.

AI를 공개함으로써 더 많은 기업이 AI를 활용해서 다양한 제품과 서비스를 만들게 된다. 어느 한 기업이 AI 모델부터 모든 산업 응용까지 다 직접 하는 것은 불가능하다. AI 기업들은 공개된 AI를 더욱 자유롭게 활용해 매우 다양한 AI 에이전트 같은 서비스를 만들 수 있다. 민감 데이터 유출이 걱정되는 기업들도 오픈소스 AI를 활용하면 보안 문제가 해결된다.

가령 전체 AI 시장의 크기가 100이라고 하면 점유율을 50%를 차지해도 기업의 몫이 50에 불과하다. 하지만 AI를 공개해서 시장의 크기를 1만으로 키우면 점유율이 20%로 줄어도 그 기업의 몫은 2000이 된다.

생성형 AI는 산업·사회·과학을 혁신하는 게임 체인저 기반 기술이다. 그래서 사람들이 AI를 전기에 비유한다. 특정 기업이 성능 좋은 AI를 오픈소스로 공개하고 많은 나라가 사용하면 전 세계의 산업·사회·경제에 영향을 끼칠 수 있다. 한 기업이 많은 국가에 발전소와 송전 시설을 제공하는 것과 같은 효과다.

지난 1월 딥시크 R1이 공개된 이후 중국의 많은 지방정부와 기업들은 물론 국내 기업들도 딥시크를 활용 중이다. 특정 기업이나 국가가 오픈소스 AI를 지배하면 전 세계 AI 공급망을 좌우할 수 있다. 언제든 라이선스 변경을 통해 사용 요금 인상이나 활용 분야를 제한할 수 있다. 가령 국방 분야 활용은 위험하니 사용 금지 이런 식이다.

설마 그럴까? 우리는 이미 모바일 앱 수수료 인상 문제를 겪었다. 강력한 자체 AI 개발 역량 없이 활용만 잘하면 된다는 주장이 위험한 이유도 이런 종속 가능성 때문이다. 중국 정부가 작년부터 자국 기업들의 오픈소스 AI를 지원하는 중요한 이유다. 오픈AI가 미국 AI 전략에 미국은 물론 동맹국까지 중국의 오픈소스 AI 사용 금지를 요청한 이유도 이 때문이다.

미국, 중국뿐만이 아니다. 지난 2월 프랑스의 미스트랄이 아랍어와 인도어 AI를 출시해서 중동과 인도 지역을 공략하기 시작했다. EU는 유럽의 AI 주권 확보를 위해 오픈소스 프로젝트인 ‘Open Euro LLM’을 출범해 유럽 이외 지역 언어로 확장할 것이라 선언했다.

오픈소스 AI 경쟁력이 국력인 시대, 경쟁국은 이미 움직이기 시작했다. 우리는 어떻게 할 것인가? 현재 정부가 추진하는 월드베스트LLM 프로젝트의 성공이 중요하다. 여기서 개발된 글로벌 수준의 AI를 상업적 용도로 활용 가능하게 전 세계에 공개해야 한다. 국민 세금으로 산 그래픽 처리 장치(GPU)를 썼기 때문이다. 이를 통해 수많은 국내 AI 응용 기업이 성장하고 국내 오픈소스 AI 생태계가 빠르게 발전할 수 있다.

다음으로는 중동, 동남아시아 등 AI 학습 데이터를 구축하는 이니셔티브를 추진하자. 이렇게 확보한 대규모 다국어 데이터를 기반으로, 이들 국가와 함께 글로벌 다문화 포용형 오픈소스 AI 프로젝트를 우리가 주도할 수 있다. 글로벌 오픈소스 AI 생태계 프로젝트가 새 정부의 핵심 AI 공약으로 자리 잡기를 기대한다.

매일 조선일보에 실린 칼럼 5개가 담긴 뉴스레터를 받아보세요. 세상에 대한 통찰을 얻을 수 있습니다.
'5분 칼럼' 구독하기(https://page.stibee.com/subscriptions/91170)

Copyright © 조선일보. 무단전재 및 재배포 금지.