[AI 기획] `딥시크 충격` 이젠 개방성으로… 오픈AI, 전략 고심

팽동현 2025. 2. 2. 17:19
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

AI 생태계 변화 조짐… 올트먼 "역사의 잘못된 편에 서있다"
글로벌 빅테크 "인공지능 발전 도움"… 아리바바도 큐원 공개
AI로 생성한 이미지.
레딧 스레드 캡처

오픈AI와 미국 빅테크들이 주도해온 인공지능(AI) 생태계에 변화가 감지된다. 중국 딥시크(DeepSeek)가 가성비를 앞세워 돌풍을 일으킨 영향이다. AI분야 올해의 화두로 AI 에이전트 및 추론과 함께 개방성이 부상하고 있다.

샘 올트먼 오픈AI 최고경영자(CEO)는 1일(이하 현지시간) 온라인 커뮤니티 레딧 이용자들과 가진 AMA(Ask Me Anything, 질의응답) 세션에서 향후 AI모델의 가중치와 연구논문 공개 의향을 묻는 질문에 "논의 중"이라며 "개인적으로는 우리가 역사의 잘못된 편에 서 있었으며 다른 오픈소스 전략을 찾을 필요가 있다고 생각한다"고 답했다.

◇샘 올트먼 "다른 오픈소스 전략 필요"= 다만 그는 "오픈AI의 모든 구성원이 이 견해를 공유하는 것은 아니며, 현재 최우선 순위도 아니다"고 덧붙였다. 케빈 웨일 최고제품책임자(CPO)는 "(과거 GPT-2 등 출시 때) 이미 이런 작업을 수행한 적 있으며, 확실히 더 많은 것을 고려하고 있다"고 설명했다.

또 추론모델의 사고과정(CoT) 공개 가능 여부에 대해 올트먼 CEO는 "훨씬 더 유용하고 자세한 버전을 곧 공개할 예정"이라며 "(이를 먼저 선보인 딥시크의) R1 덕분"이라 말했다. 이에 웨일 CPO는 "모든 CoT 공개가 경쟁적인 증류(distillation)로 이어질 수도 있겠으나 이용자들, 특히 파워유저들이 이를 원한다는 점도 알고 있으므로 균형을 맞출 수 있는 적절한 방법을 찾을 것"이라 부연했다.

중국 딥시크가 지난달 20일 출시한 AI모델 '딥시크-R1'은 여러 벤치마크에서 오픈AI의 추론모델 o1(오원)과 맞먹거나 일부 능가하는 성능을 보였다. 딥시크-R1의 기반이 되는 '딥시크-V3' 기준으로 모델 훈련에 약 558만달러(약 81억원)의 비용만 들었다고 밝혀 미국을 비롯한 세계 AI업계를 놀라게 했다. 나아가 회사가 이를 논문과 함께 오픈모델로 공개한 점 또한 화제가 됐다.

이에 대해 AI 4대 석학 중 하나인 얀 르쿤 메타 수석AI과학자는 "딥시크의 성과를 두고 '중국이 AI분야에서 미국을 능가하고 있다'고 생각한다면 잘못 짚는 것이다. '오픈소스 모델이 독점적 모델을 능가하고 있다'가 정확하다"는 견해를 냈다. 메타는 '라마(LLaMA)' 모델들을 개발·배포하며 이런 오픈모델 움직임을 선도적으로 이끈 회사이기도 하다.

◇사티아 나델라 "딥시크, 진정한 혁신 보여줘"= 한편 마이크로소프트(MS) 사티아 나델라 최고경영자(CEO)는 지난 29일 실적 발표 후 투자자들과 가진 콘퍼런스콜에서 딥시크에 대한 질문을 받고 "진정한 혁신을 보여주고 있다"고 말했다. 이어 "(딥시크 등장은) AI 발전이 기존 컴퓨팅 기술 발전과 유사한 과정을 거치고 있음을 시사한다"며 기술이 발전하면서 성능은 향상되고 비용은 낮아지는 일반적인 패턴을 따른다고 설명했다. 그러면서 "MS가 지원하는 오픈AI도 유사한 개선을 보이고 있다"며 "궁극적으로 모든 것이 상품화될 것이며 고객이 주요 수혜자가 될 것"이라고 말했다.

팀 쿡 애플 CEO도 지난 30일 실적 발표 후 콘퍼런스콜에서 "일반적으로 효율성을 높이는 혁신은 좋은 일이라고 생각한다. 딥시크 모델에서 볼 수 있는 것이 바로 그것"이라면서 "실리콘(하드웨어)과 소프트웨어의 긴밀한 통합은 앞으로도 계속해서 우리에게 큰 도움이 될 것이라고 생각한다"고 말했다. 마크 저커버그 메타플랫폼 CEO는 지난 29일 딥시크의 성과가 인프라 투자 및 자본 지출에 미치는 영향에 대한 의견을 내놓기에는 아직 이르다고 밝히면서 "현재 상황이 단순하지 않으며, 단 하나의 AI 모델에서 나온 초기 보고서나 결과가 전체적인 판도를 근본적으로 바꾸지는 않는다"고 신중한 입장을 보였다.

◇알리바바도 개방성 움직임에 동참= 이 가운데 딥시크는 오픈AI 모델들의 답변을 이용해 자사 모델을 학습시키는 방식인 증류를 썼다는 의혹을 받아 오픈AI와 MS가 조사에 나섰고, 세미애널리시스에 따르면 명목상이 아니라 실질적인 총 훈련비용은 5억달러 이상일 것으로 추산되고 있다. 또 개방성 관련해 데이터나 소스코드 등을 전부 공개하지 않으면서 오픈소스라 칭할 수 있는지에 대해서는 딥시크뿐 아니라 앞서 메타와 구글의 오픈모델 발표 때부터 업계 내에도 논쟁이 있어왔다.

이런 이슈와 별개로 이번에 오픈AI가 전환적인 입장을 취하는 등 딥시크 등장에 따라 개방성을 지향하는 흐름은 가속화되는 분위기다. 앞서 알리바바클라우드 또한 지난달 29일 '큐원(Qwen) 2.5-맥스' 모델을 공개하며 이런 흐름에 합류했다. 중국 내에서 딥시크와 직접 경쟁 중인 이 회사는 "GPT-4o와 딥시크-V3, 라마-3.1-405B를 거의 모든 영역에서 능가한다"면서 모델 이용료도 기존보다 97% 인하했다.

또 마이크로소프트(MS) 공동창업자인 고(故) 폴 앨런이 세운 앨런인공지능연구소(Ai2)는 지난달 30일 새로운 오픈모델 '툴루(Tulu) 3-405B'를 발표했다. 마찬가지로 성능 비교 대상을 GPT-4o와 딥시크-V3로 잡았는데, '검증 가능한 보상을 통한 강화 학습(RLVR)' 기법으로 사후훈련에 초점을 맞췄고 데이터와 코드도 제공하면서 '진짜 오픈소스'를 표방하는 게 차이점이다.

◇오픈AI, 소형모델 'o3 미니' 공개= 한편 오픈AI는 지난달 31일 비용효율적인 고급 추론능력을 강조하며 소형모델 'o3(오쓰리)-미니(mini)'를 예정대로 출시했다. 'o3 미니'는 오픈AI가 지난해 9월 출시한 추론 모델 'o1'(오원)의 업그레이드 버전인 'o3'의 소형 모델이다.

추론 능력에 초점을 둔 'o3'는 'o1'과 마찬가지로 응답하기 전 먼저 생각하도록 훈련됐다. 작업을 추론하고 계획할 수 있으며, 오랜 기간에 걸친 작업을 해나가는 데 있어 해결책을 찾는 데 도움이 된다고 오픈AI는 설명했다. 또 'o1'과 마찬가지로 응답에는 몇 초∼몇 분 더 걸리지만, 물리학·과학·수학과 같은 분야에서 더 신뢰할 수 있다고 오픈AI는 밝혔다. 'o3'와 'o3 미니'는 작년 12월 처음 공개됐다.

'o3 미니'는 챗GPT를 통해 무료로 사용할 수 있다. 챗GPT 플러스와 프로 및 팀 등 유료 구독자도 이용할 수 있으며, 기업 유료 구독자에게는 일주일 안에 배포될 예정이다. 추론 능력을 낮음(low)·중간(medium)·높음(high) 세 가지 옵션 중 택해 적용할 수 있는데, 중간 정도로도 기존 o1의 성능과 유사하다는 게 회사의 설명이다. 현재 기본 o3-미니는 무료로 사용 가능하며, 챗GPT 플러스 구독자의 경우 o3-미니-하이도 주 50회 이용 가능하다.

올트먼 CEO는 레딧 AMA 세션에서 딥시크에 대해 묻는 질문에 "아주 좋은 모델"이라며 "우리는 더 나은 모델들을 만들어 나가겠지만, 우위를 점하는 부분은 이전보다 적어질 것"이라 말했다. o3 정식 버전 출시에 대해선 "수주 이상, 수개월 이내"라고 답했다.

이날 오픈AI는 콘텍스트창 확대와 함께 추론모델의 파일 첨부, 이미지 생성, 메모리 지원 등 기능들 추가를 위한 작업도 진행 중이라고 밝혔다.팽동현기자 dhp@dt.co.kr

Copyright © 디지털타임스. 무단전재 및 재배포 금지.