[분석] "오픈소스는 공짜라는 착각"···생태계 종속 노린 빅테크의 '숨은 계산서'

김성하 기자 2026. 4. 21. 21:33
음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

구글 젬마4 기업·개발자 사이서 주목 받아
공개 통해 '생태계 선점' 이후 고도화 노려
현업서는 '적정 성능 대비 비용 효율' 우선
오픈과 클로즈드 결합 이중구조 고착될 것
오픈소스 인공지능(AI)에 대한 시장 인식이 빠르게 바뀌고 있다. /챗GPT 생성 이미지

구글이 공개한 오픈소스 대형언어모델(LLM) '젬마4(Gemma4)'를 계기로 오픈소스 인공지능(AI)에 대한 시장 인식이 빠르게 바뀌고 있다. 로컬 환경에서 직접 실행 가능한 구조와 경량 설계를 바탕으로 모델이 '실제 서비스에 투입 가능한 인프라'로 재평가되면서 AI 경쟁의 축이 성능에서 비용 구조와 통제권, 생태계 확보로 이동하고 있다는 분석이다.

21일 여성경제신문 취재를 종합하면 최근 구글 딥마인드가 공개한 제품군 젬마4가 오픈소스 진영에서 긍정적인 평가를 받으며 업계의 주목을 받고 있다. 상업적 활용이 가능한 개방형 라이선스를 적용하면서도 비교적 낮은 연산 자원으로 구동 가능한 경량 구조를 채택한 것이 특징이다. 

특히 API 의존 없이 로컬 환경에서 직접 실행할 수 있다는 점이 주목된다. 데이터 외부 전송이 필요 없는 구조로 보안성과 비용 통제 측면에서 동시에 이점을 확보할 수 있기 때문이다. 스마트폰과 노트북, 데스크톱 PC 등 온디바이스 환경에서도 구동이 가능해 개발자 커뮤니티를 중심으로 빠르게 확산되고 있다.

'공짜' 아닌 '통제권'···오픈소스 재평가

그동안 오픈소스 AI 리더보드는 딥시크 등 중국 모델들이 상위권을 차지해 왔다. 미국 진영에서는 메타의 라마(LLaMA)와 엔비디아의 네모트론(Nemotron) 등이 대표적인 모델로 꼽힌다.

업계에서는 젬마4를 클로드 오퍼스 4.6이나 GPT-5.2와 같은 최고 성능 모델은 아니지만 API 비용 부담과 데이터 외부 전송 없이 활용할 수 있고 벤더 종속성에서도 벗어날 수 있다는 점에서 현실적인 대안으로 평가하고 있다.

'오픈+유료' 이중 전략···생태계 선점 경쟁
구글의 젬마4와 제미나이의 오픈과 유료 모델 병행 전략 인포그래픽 /챗GPT 생성 이미지

현재 오픈소스 LLM 시장의 경쟁 구도는 빠르게 변화하고 있다. 과거에는 메타가 오픈 전략을 통해 생태계를 확장했다면 최근에는 구글과 알리바바 등 주요 기업들이 오픈과 유료 모델을 병행하는 전략으로 이동하는 흐름이다.

구글은 젬마를 상업적 활용이 가능한 개방형 라이선스로 공개하는 동시에 제미나이를 중심으로 한 유료 API 서비스를 운영 중이다. 알리바바 역시 '큐웬(Qwen)' 시리즈 일부를 오픈소스로 공개하는 한편 최신 모델은 유료 전환 가능성을 열어두는 방식으로 수익화를 병행하고 있다.

이처럼 오픈소스를 통해 개발자 기반을 확보하고 고성능 모델은 유료로 제공하는 이중 구조가 자리 잡으면서 시장 경쟁은 '오픈 대 클로즈드' 구도를 넘어 혼합 전략 중심으로 이동하고 있다.

오픈소스의 본질은 '무료'가 아닌 '통제권'에 있다. API 기반 모델이 외부 플랫폼에 대한 의존을 전제로 하는 반면 오픈소스는 코드 수정과 자체 서비스 구축, 비용 구조 설계까지 직접 통제할 수 있다.

기업들이 성능을 일부 제한한 하위 모델을 오픈소스로 공개하는 전략도 이와 맞닿아 있다. 개발자들이 이를 기반으로 시스템을 구축하면 이후 고도화 과정에서 동일 계열의 상위 모델로 확장될 가능성이 높아지기 때문이다. 초기 공개가 단순 기술 공유를 넘어 장기적인 '생태계 선점' 전략으로 작동하는 구조다.

후발주자에 진입장벽 형성 "오픈소스의 양면성"

동시에 진입 장벽을 높이는 역할도 한다. 빅테크가 일정 수준 이상의 성능을 갖춘 모델을 오픈소스로 제공할 경우 중소 개발사와 스타트업은 초기 성능 격차를 좁히기 어려워진다. 오픈소스는 기술 확산을 촉진하는 동시에 후발주자의 진입 여지를 축소시키는 '양면 구조'로 작동하고 있다.

다만 성능 측면에서는 여전히 클로즈드 모델이 우위에 있다. 유료 모델은 지속적인 업데이트를 통해 최신 성능을 유지할 수 있지만 오픈소스는 구축 이후 자동 개선이 이뤄지지 않는다. 최신 성능을 유지하려면 사용자가 직접 업데이트와 튜닝을 수행해야 한다.

실무 기준은 '성능' 아닌 '비용 효율'
실제 현업에서는 최고 성능보다 '적정 성능 대비 비용 효율'을 기준으로 모델을 선택하는 사례가 늘고 있다. /챗GPT 생성 이미지

그럼에도 오픈소스 확산이 이어지는 배경에는 비용 구조가 있다. 클로즈드 모델은 사용량 증가에 따라 비용이 빠르게 확대되는 구조인 반면 오픈소스는 초기 구축 이후 비용 통제가 가능하다.

실제 현업에서는 최고 성능보다 '적정 성능 대비 비용 효율'을 기준으로 모델을 선택하는 사례가 늘고 있다. 현직 개발자 A씨는 본지에 "클로즈드 모델은 성능 개선이 자동 반영되는 대신 사용량에 따라 비용이 증가하는 구조"라며 "서비스 규모가 커질수록 비용 부담이 급증한다"고 말했다.

이어 "반면 오픈소스는 모델 업데이트부터 파인튜닝, 서빙까지 전 과정을 직접 운영해야 하는 부담이 있지만 그만큼 성능과 비용을 원하는 수준으로 조정할 수 있다"며 "서비스 규모가 커질수록 비용을 통제할 수 있다는 점에서 실무에서는 오픈소스를 선택하는 경우가 늘고 있다"고 설명했다.

'모델 규모가 클수록 성능이 우수하다' 공식 깨져

기술 흐름 역시 변화하고 있다. 최근에는 소형 모델이 특정 작업에서 대형 모델과 유사하거나 더 나은 성능을 보이는 사례가 늘어나면서 '모델 규모가 클수록 성능이 우수하다'는 기존 공식이 약화되는 모습이다.

실제로 젬마 시리즈는 수십억 단위 파라미터 규모임에도 일부 벤치마크에서 수백억 단위 모델과 유사한 성능을 기록한 것으로 알려졌다. 프랑스 AI 스타트업 미스트랄(Mistral)의 7B 모델 역시 이전 세대 30B급 모델과 경쟁 가능한 성능을 보이며 경량화 흐름을 확산시킨 사례로 꼽힌다.

모델 최적화와 파인튜닝 기술이 발전하면서 단순한 파라미터 규모가 아닌 학습 효율과 구조 설계가 성능을 좌우하는 요소로 부상하고 있다. AI 경쟁의 중심이 '크기'에서 '효율'로 이동하고 있다는 분석이 나오는 이유다.

결국 기업들이 오픈소스 모델을 공개하는 이유는 △생태계 선점 △후발주자 진입 장벽 형성 △효율성 확보 △모델 경쟁 패러다임 변화에 대응하기 위한 복합 전략에 있다.

오픈소스는 비용을 포기하는 전략이 아니라 장기적인 수익 구조를 설계하기 위한 진입 전략에 가깝다. 업계에서는 이러한 흐름이 이어질 경우 오픈소스 모델이 AI 인프라의 기본 선택지로 자리 잡고 상위 성능을 요구하는 영역에서는 유료 모델이 결합되는 이중 구조가 더욱 고착화될 것으로 보고 있다.

☞ 오픈소스 AI = 모델 구조와 일부 코드, 가중치를 공개해 누구나 수정·활용할 수 있도록 한 AI다. 비용 통제와 자체 서비스 구축이 가능하다는 장점이 있다.

☞ 클로즈드 모델 = 기업이 내부에서만 운영하며 API 형태로 제공하는 AI 모델이다. 성능 업데이트가 자동으로 반영되지만 사용량에 따라 비용이 증가하는 구조다.

☞ API = 외부 서비스나 모델을 호출해 기능을 사용하는 방식이다. 자체 구축 없이 빠르게 적용할 수 있지만 플랫폼 종속성이 발생한다.

여성경제신문 김성하 기자
lysf@seoulmedia.co.kr

*여성경제신문 기사는 기자 혹은 외부 필자가 작성 후 AI를 이용해 교정교열하고 문장을 다듬었음을 밝힙니다. 기사에 포함된 이미지 중 AI로 생성한 이미지는 사진 캡션에 밝혀두었습니다.

여성경제신문에서 직접 확인하세요. 해당 언론사로 이동합니다.