‘오픈소스’ 문이 닫힌다… 챗GPT가 촉발한 데이터 전쟁

김민석 2023. 4. 20. 17:26
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

생성형 인공지능(AI) 업계가 급성장하며 '오픈소스'의 문이 닫히고 있다.

무료로 공개하던 소스코드를 비공개하거나 애플리케이션 프로그램 인터페이스(API)를 유료화하는 등 정책을 폐쇄적으로 바꾸고 있다.

매일 약 5700만명이 방문해 다양한 주제로 대화하는 미국의 초대형 커뮤니티 사이트인 '레딧'은 수년 간 퍼블릭 API를 통해 구글, 오픈AI, 마이크로소프트(MS)와 등이 개발하는 초거대 인공지능 언어 모델의 학습 자료를 무료로 제공해 왔다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

레딧 “AI ‘공짜 선생’ 이제 없다”
대화 DB 접근 API 유료화 선언
“스타트업엔 유료 API가 수익원”
구글 기술 쓴 오픈AI, 폐쇄 흐름 시작
스태빌리티AI는 언어모델 무료 공개

생성형 인공지능(AI) 업계가 급성장하며 ‘오픈소스’의 문이 닫히고 있다. 무료로 공개하던 소스코드를 비공개하거나 애플리케이션 프로그램 인터페이스(API)를 유료화하는 등 정책을 폐쇄적으로 바꾸고 있다. 학습과 개발엔 큰 돈이 들어가지만 수익화는 어려운 AI 업계의 현실 때문에 일어나는 현상으로 풀이된다.

오픈AI 로고

매일 약 5700만명이 방문해 다양한 주제로 대화하는 미국의 초대형 커뮤니티 사이트인 ‘레딧’은 수년 간 퍼블릭 API를 통해 구글, 오픈AI, 마이크로소프트(MS)와 등이 개발하는 초거대 인공지능 언어 모델의 학습 자료를 무료로 제공해 왔다. API는 프로그램(앱)들 사이의 상호작용을 위해 필수적인 매개체다. 아주 쉽게 설명하면 특정 서버의 일부분에 접속해서 그 안의 데이터와 서비스를 사용할 수 있게 해 주는 소프트웨어 도구다. 내부에서만 사용하는 프라이빗 API, 특정 사업 파트너와 공유되는 파트너 API, 모두에게 제공되는 공개(퍼블릭) API가 있다.

하지만 최근 이 회사는 이 API 접근에 요금을 부과하기로 했다. 레딧 창업자이자 최고경영자(CEO)인 스티브 허프먼은 “레딧의 말뭉치 데이터는 상당히 가치있다”며 “그러나 우리가 그 모든 가치를 세계에서 가장 큰 회사들에게 무료로 줄 필요는 없다”고 말했다. 트위터를 인수한 일론 머스크 역시 지난해말 “오픈AI가 AI 모델 학습을 위해 트위터 데이터베이스에 접근하고 있다는 사실을 알게 됐다”며 “앞으로 AI 기업들이 무단으로 데이터베이스에 접근하는 것을 금지시킬 것”이라고 밝혔다. 트위터는 지난 2월 데이터베이스에 접근할 수 있는 API를 유료화 했다.

지적재산권(IP) 개념이 강화되는 다른 분야와 달리, 활발하게 새로운 앱과 서비스를 개발해야 하는 정보통신기술(ICT) 업계에선 개발의 ‘설계도’에 해당하는 소스코드를 무료로 공개하는 흐름이 대세였다. 퍼블릭 API로 외부인이 접근, 사용할 수 있는 데이터와 서비스 영역도 상당히 넓었다.

레딧 로고

그런데 이런 흐름은 AI 기술 경쟁이 심화되면서 약해지고 있다. 대기업은 천문학적인 돈을 들여 개발한 AI인데, 후발 주자에게 주도권을 빼앗기면 타격이 크기 때문이고, 중소 기술 기업은 유료 API가 주요 수입원이다. 업계 관계자는 “AI는 수익화가 어려워 스타트업들은 API를 유료화하지 않으면 살아남기 어렵다”고 설명했다.

역설적이게도 이런 오픈소스 폐쇄 흐름은 오픈AI에서 시작됐다. 언어모델 GPT-3를 개발했을 때까지만 해도 소스코드와 API를 공개했지만, GPT-4에 와서는 “‘경쟁 환경’과 ‘안정성’을 위해” 소스코드는 물론 모델 크기와 학습한 데이터, 사용한 하드웨어 등 어떤 정보도 공개하지 않고 있다. 유료 계약을 통해 GPT를 사용할 수 있는 API를 부여하고 있을 뿐이다. GPT의 ‘T’는 ‘트랜스포머’를 의미하는데, 이는 구글이 2017년 논문으로 공개한 언어 모델이다. 구글의 기술 덕에 GPT를 개발한 오픈AI가 후발 주자에겐 어떤 것도 공개하지 않는 셈이다.

하지만 그럼에도 끝까지 오픈소스 정신을 고집하는 경우도 있다. 이미지 생성 모델 ‘스테이블디퓨전’으로 유명한 스태빌리티AI는 19일(현지시간) 오픈소스 기반 초거대 언어모델 ‘스테이블LM’을 출시, 깃허브 등에 무료로 공개, 누구나 활용하고 변형할 수 있도록 했다.

김민석 기자

▶ 밀리터리 인사이드 - 저작권자 ⓒ 서울신문사 -

Copyright © 서울신문. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?