‘오픈소스’ 문이 닫힌다… 챗GPT가 촉발한 데이터 전쟁
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
생성형 인공지능(AI) 업계가 급성장하며 '오픈소스'의 문이 닫히고 있다.
무료로 공개하던 소스코드를 비공개하거나 애플리케이션 프로그램 인터페이스(API)를 유료화하는 등 정책을 폐쇄적으로 바꾸고 있다.
매일 약 5700만명이 방문해 다양한 주제로 대화하는 미국의 초대형 커뮤니티 사이트인 '레딧'은 수년 간 퍼블릭 API를 통해 구글, 오픈AI, 마이크로소프트(MS)와 등이 개발하는 초거대 인공지능 언어 모델의 학습 자료를 무료로 제공해 왔다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
대화 DB 접근 API 유료화 선언
“스타트업엔 유료 API가 수익원”
구글 기술 쓴 오픈AI, 폐쇄 흐름 시작
스태빌리티AI는 언어모델 무료 공개
생성형 인공지능(AI) 업계가 급성장하며 ‘오픈소스’의 문이 닫히고 있다. 무료로 공개하던 소스코드를 비공개하거나 애플리케이션 프로그램 인터페이스(API)를 유료화하는 등 정책을 폐쇄적으로 바꾸고 있다. 학습과 개발엔 큰 돈이 들어가지만 수익화는 어려운 AI 업계의 현실 때문에 일어나는 현상으로 풀이된다.
매일 약 5700만명이 방문해 다양한 주제로 대화하는 미국의 초대형 커뮤니티 사이트인 ‘레딧’은 수년 간 퍼블릭 API를 통해 구글, 오픈AI, 마이크로소프트(MS)와 등이 개발하는 초거대 인공지능 언어 모델의 학습 자료를 무료로 제공해 왔다. API는 프로그램(앱)들 사이의 상호작용을 위해 필수적인 매개체다. 아주 쉽게 설명하면 특정 서버의 일부분에 접속해서 그 안의 데이터와 서비스를 사용할 수 있게 해 주는 소프트웨어 도구다. 내부에서만 사용하는 프라이빗 API, 특정 사업 파트너와 공유되는 파트너 API, 모두에게 제공되는 공개(퍼블릭) API가 있다.
하지만 최근 이 회사는 이 API 접근에 요금을 부과하기로 했다. 레딧 창업자이자 최고경영자(CEO)인 스티브 허프먼은 “레딧의 말뭉치 데이터는 상당히 가치있다”며 “그러나 우리가 그 모든 가치를 세계에서 가장 큰 회사들에게 무료로 줄 필요는 없다”고 말했다. 트위터를 인수한 일론 머스크 역시 지난해말 “오픈AI가 AI 모델 학습을 위해 트위터 데이터베이스에 접근하고 있다는 사실을 알게 됐다”며 “앞으로 AI 기업들이 무단으로 데이터베이스에 접근하는 것을 금지시킬 것”이라고 밝혔다. 트위터는 지난 2월 데이터베이스에 접근할 수 있는 API를 유료화 했다.
지적재산권(IP) 개념이 강화되는 다른 분야와 달리, 활발하게 새로운 앱과 서비스를 개발해야 하는 정보통신기술(ICT) 업계에선 개발의 ‘설계도’에 해당하는 소스코드를 무료로 공개하는 흐름이 대세였다. 퍼블릭 API로 외부인이 접근, 사용할 수 있는 데이터와 서비스 영역도 상당히 넓었다.
그런데 이런 흐름은 AI 기술 경쟁이 심화되면서 약해지고 있다. 대기업은 천문학적인 돈을 들여 개발한 AI인데, 후발 주자에게 주도권을 빼앗기면 타격이 크기 때문이고, 중소 기술 기업은 유료 API가 주요 수입원이다. 업계 관계자는 “AI는 수익화가 어려워 스타트업들은 API를 유료화하지 않으면 살아남기 어렵다”고 설명했다.
역설적이게도 이런 오픈소스 폐쇄 흐름은 오픈AI에서 시작됐다. 언어모델 GPT-3를 개발했을 때까지만 해도 소스코드와 API를 공개했지만, GPT-4에 와서는 “‘경쟁 환경’과 ‘안정성’을 위해” 소스코드는 물론 모델 크기와 학습한 데이터, 사용한 하드웨어 등 어떤 정보도 공개하지 않고 있다. 유료 계약을 통해 GPT를 사용할 수 있는 API를 부여하고 있을 뿐이다. GPT의 ‘T’는 ‘트랜스포머’를 의미하는데, 이는 구글이 2017년 논문으로 공개한 언어 모델이다. 구글의 기술 덕에 GPT를 개발한 오픈AI가 후발 주자에겐 어떤 것도 공개하지 않는 셈이다.
하지만 그럼에도 끝까지 오픈소스 정신을 고집하는 경우도 있다. 이미지 생성 모델 ‘스테이블디퓨전’으로 유명한 스태빌리티AI는 19일(현지시간) 오픈소스 기반 초거대 언어모델 ‘스테이블LM’을 출시, 깃허브 등에 무료로 공개, 누구나 활용하고 변형할 수 있도록 했다.
김민석 기자
▶ 밀리터리 인사이드 - 저작권자 ⓒ 서울신문사 -
Copyright © 서울신문. 무단전재 및 재배포 금지.
- 아스트로 문빈 자택서 사망…극단적 선택 추정
- 물건 훔치고 이름·연락처 남긴 편의점 절도범…“미안해서”
- ‘시속 184㎞’ 동승자 사망케 한 60대 여성 2심서 무죄 이유는?
- “자녀 둘 낳았나요? ‘세금’ 내지 마세요”…파격 시도 伊정부
- “뒤로 넘어가 경추 다쳐”…공원 ‘거꾸리’ 타다 ‘사지마비’
- “38만원, 이게 장애인 평균 월급입니다”
- 인천 아파트 지하 창고서 백골 시신 발견
- 김 싼 밥만 놓고 2살 방치→사망…母 “애 잘 때만 PC방”
- 4세 팔꿈치 수술 돌연사…마취 의사는 2분 머물렀다
- 20대 여성, 출근길 횡단보도서 음주뺑소니 차량에 의식불명