챗GPT와 유사한 오픈소스 모델 공개됐지만…

김우용 기자 2023. 1. 3. 09:33
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

오픈AI의 챗봇 '챗GPT'와 유사하게 동작하는 오픈소스 모델이 공개됐다.

하지만 실제 작동까지 필요한 비용이 너무 커 챗GPT 대안역할을 하긴 힘들 것으로 예상된다.

2일(현지시간) 테크크런치에 따르면, 메타의 비공개 AI 시스템 리버스 엔지니어링 담당 개발자인 필립 왕은 챗GPT와 유사한 기능을 할 수 있는 텍스트 생성 AI 모델 'PaLM+RLHF'를 깃허브에 오픈소스로 공개했다.

오픈AI가 사전 훈련한 챗GPT와 달리 PaLM+RLHF는 사전 훈련되지 않았다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

(지디넷코리아=김우용 기자)오픈AI의 챗봇 '챗GPT'와 유사하게 동작하는 오픈소스 모델이 공개됐다. 하지만 실제 작동까지 필요한 비용이 너무 커 챗GPT 대안역할을 하긴 힘들 것으로 예상된다.

2일(현지시간) 테크크런치에 따르면, 메타의 비공개 AI 시스템 리버스 엔지니어링 담당 개발자인 필립 왕은 챗GPT와 유사한 기능을 할 수 있는 텍스트 생성 AI 모델 'PaLM+RLHF'를 깃허브에 오픈소스로 공개했다.

PaLM은 구글의 대규모 언어모델이고, RLHF는 인간의 피드백을 통한 강화학습이다. 두 기술을 결합해 메일 작성, 코드 제안 등 챗GPT로 가능한 작업을 할 수 있다.

챗GPT(이미지=오픈AI)

오픈AI가 사전 훈련한 챗GPT와 달리 PaLM+RLHF는 사전 훈련되지 않았다. 실제 작동에 필요한 데이터 학습을 사용자가 직접해야 한다는 의미다. 사용자는 모델 학습에 필요한 컴퓨팅 자원을 확보해야 한다.

필립 왕은 "고차원 매개변수 공간에서 올바른 지점으로 나아가려면 여전히 수백만 달러의 컴퓨팅과 데이터가 필요하다"며 "난기를 통해 배를 그 지점까지 실제로 안내하려면 전문 선원이 필요하다"고 조언했다.

개발자도 밝혔듯 데이터와 하드웨어를 확보하는데 막대한 비용이 필요하다.

지난 2020년 한 연구에 의하면 매개변수 15억개 규모의 텍스트 생성 모델을 개발하는 비용은 최대 160만달러다. PaLM의 매개변수 규모는 5천400억개다.

GPT3 수준의 오픈소스 언어 모델인 '블룸(Bloom)'은 학습에  엔비디아 A100 GPU 384개를 3개월동안 돌려야 했다. 블룸으로 학습된 모델을 실행하는데는 A100 GPU 8개를 장착한 전용 하드웨어가 필요하다.

테크크런치는 1천750억개 매개변수 규모의 오픈AI GPT3 실행 비용이 아마존웹서비스(AWS) 인스턴스에서 연간 8만7천달러라고 전했다.

챗GPT를 복제하려는 또다른 움직임이 이미 있다. CarperAI란 그룹이 시도하고 있다. 비영리단체 LAION도 챗GPT 복제 프로젝트를 주도하고 있다.

김우용 기자(yong2@zdnet.co.kr)

Copyright © 지디넷코리아. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?