GPT-4 앞지른 ‘무료 AI’···수조 쓴 빅테크 고민 깊어진다

허진 기자 2023. 9. 11. 18:02
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

오픈소스 진영을 중심으로 생성형 인공지능(AI) 기술 혁신이 가속화하자 구글과 오픈AI 등 빅테크의 고민이 깊어지고 있다.

물론 업계에서는 여전히 고급 추론이나 하위 업무를 할당하는 능력 등 단순 수치 비교로만 드러나지 않는 분야에서 GPT-4가 단일 모델 최고 성능을 지닌 것으로 평가하지만 LLM이 실제 적용되는 개별 비즈니스 영역에서만큼은 오픈소스를 활용해 개발한 LLM이 빅테크 모델을 충분히 대체할 수 있다는 분석도 나온다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

메타, 코딩 특화 '코드라마' 내놔
개량버전 오픈AI보다 성능 앞서
쏘카·티맵 자체 모델 개발 열중
기업용 선보이는 등 빅테크 응전
[서울경제]

오픈소스 진영을 중심으로 생성형 인공지능(AI) 기술 혁신이 가속화하자 구글과 오픈AI 등 빅테크의 고민이 깊어지고 있다. 수개월 전만 해도 기술 격차를 바탕으로 시장을 장악할 기세였지만 초거대 AI 개발 인프라가 대중화하면서 성능 좋은 무료 모델이 속속 등장해 기업들과 일반인들의 선택지가 넓어졌기 때문이다. 이에 따라 거대언어모델(LLM) 개발에 막대한 비용을 쏟아부은 빅테크로서는 향후 비즈니스 모델 구축과 수익성 확보 방안을 마련해야 하는 과제를 안게 됐다.

11일 업계에 따르면 오픈소스 진영에서 개발한 LLM들이 일부 영역에서 빅테크의 기술력을 앞지르는 사례가 속속 생겨나고 있다.

메타는 오픈소스 LLM인 ‘라마2'(Llama2)를 공개한 지 약 한달 만에 이를 가공해 코딩 기능에 특화한 ‘코드라마(Code Llama)’를 지난달 24일(현지시각) 공개했다. 코드라마는 개발자 커뮤니티를 거치며 오픈AI의 최신 모델 ‘GPT-4’의 성능을 넘보고 있다. 최근 AI 스타트업 ‘파인드’가 코드라마를 미세조정한 모델을 내놨는데, 이 모델은 생성형 AI의 코딩 능력을 평가하는 벤치마크인 ‘휴먼이벌(HumanEval)’에서 GPT-4를 넘어서는 점수를 획득했다.

AI스타트업 Phind가 개발한 모델은 HumanEval 벤치마크에서 GPT-4 성능을 넘어섰다.사진=허깅페이스 캡쳐

올해 초만 해도 조연에 머물던 오픈소스 모델들은 최근 들어 두드러진 활약을 보이고 있다. 값비싼 컴퓨팅 인프라를 구매하지 않고 사용할 수 있는 방법이 다양해지고 개발·연구자들이 활용할 수 있는 오픈소스 모델이 다양하게 개방되면서다. 특히 라마2는 직전 모델과 달리 상업용 라이선스가 허용되면서 오픈소스 진영의 새로운 모멘텀으로 작용했다.

물론 업계에서는 여전히 고급 추론이나 하위 업무를 할당하는 능력 등 단순 수치 비교로만 드러나지 않는 분야에서 GPT-4가 단일 모델 최고 성능을 지닌 것으로 평가하지만 LLM이 실제 적용되는 개별 비즈니스 영역에서만큼은 오픈소스를 활용해 개발한 LLM이 빅테크 모델을 충분히 대체할 수 있다는 분석도 나온다. 업계의 한 관계자는 “챗봇을 만드는 정도의 작업에 GPT-4를 적용하는 건 마치 모기를 잡는데 대포를 쏘는 것”이라며 “특히 한국어는 비용 측면에서 빅테크 모델을 사용하기에 불리한 점이 있기에 비영어권 국가라면 오픈소스 모델 수요가 클 것”이라고 말했다.

당장 국내 기업들부터 값비싼 빅테크 모델을 대체할 오픈소스 모델 기반의 자체 LLM 개발에 열을 올리고 있다. 쏘카는 GPT 애플리케이션 프로그래밍 인터페이스(API)를 활용해왔지만 비용을 절감하고 자사 서비스에 한층 특화한 모델을 위해 오픈소스에 기반한 자체 모델 개발을 모색하고 있다. 티맵모빌리티 역시 GPT, 구글의 바드 API를 통해 AI 기술 적용 방향을 연구하는 한편 장기적으로는 자체 모델 구축을 바라보고 있다. 업스테이지는 아예 자체 모델을 구축하려는 기업들을 겨냥해 라마2를 미세조정한 모델과 개별 기업 데이터를 결합해 프라이빗 LLM을 구축하고 있다.

메타는 지난 7월 상업적 사용이 가능한 오픈소스 LLM 라마2를 공개했다.사진제공=메타

빅테크도 오픈소스 진영의 움직임을 예의주시하면서 대응에 나서고 있다. 오픈AI가 최근 기업용 서비스 챗GPT 엔터프라이즈 버전을 내놓은 것이 대표적이다. 그간 API를 제공하며 기업들의 챗봇 구축 수요에 간접적으로 대응해왔다면 이제는 기업간거래(B2B) 시장을 겨냥해 보다 빠르고 보안성이 강화된 서비스를 출시한 것이다. 업계의 또다른 관계자는 “오픈소스 기반 LLM이 진화하면서 생성형 AI 개발에 막대한 비용을 쏟아부은 빅테크로서는 투자 비용을 회수할 수 있는 수익모델을 구축하는 것이 과제가 됐다"면서 “자체 제품·서비스에 LLM을 탑재하거나 B2B 시장을 공략하는 전략을 택할 것으로 예상된다”고 짚었다.

허진 기자 hjin@sedaily.com

Copyright © 서울경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?