[테크토크]왜 구글은 'AI 해자'가 없다고 했을까

임주형 2023. 5. 20. 18:00
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

구글, 오픈AI 등 '폐쇄 AI' 전략
훈련법 감추고 기술 우위 노려
이에 반발한 오픈소스 득세
커뮤니티가 빅테크 압도할 수도

"우리에게는 해자(moat)가 없고, 오픈AI에게도 없다. 불편한 진실은 AI 경쟁에서 승리할 회사는 우리나 오픈AI가 아니라는 것이다. 제3 세력이 떠오르고 있고, 그 이름은 오픈소스다."

지난 4일(현지시간) 미국 반도체 분석 그룹 '세미애널리시스'가 유출한 구글 사내 메시지 내용입니다. '해자'란 한 기업의 초격차를 유지할 결정적인 기술력을 뜻하는 단어로, 구글 인공지능(AI) 기술자들은 미래 AI 산업의 주도권이 자신들에게 없다고 실토한 셈입니다.

메시지는 구글, 챗GPT를 개발한 오픈AI를 뛰어넘을 제3 세력으로 '오픈소스'를 언급했습니다. 오픈소스는 AI 모델과 관련된 모든 정보를 무료로 개방해 이용자들이 자유롭게 개발하도록 유도하는 전략입니다. 왜 구글 개발자들은 오픈소스 AI를 경계하는 걸까요.

훈련 노하우가 곧 AI 기술…영업비밀 감추는 빅테크

샘 올트만 오픈AI 최고경영자 [이미지출처=EPA연합뉴스]

신경망 AI를 만들고 구동하는 작업은 크게 '훈련'과 '추론'으로 구분됩니다. 훈련은 방대한 데이터 세트를 AI에 훈련하는 작업입니다. 한편 추론은 훈련 완료된 AI를 바탕으로 다양한 작업을 수행하는 겁니다.

오픈AI, 구글, 구글의 AI 전문 연구 기업 '딥마인드' 등 유명 AI 기업들은 훈련과 추론 분야 모두 최고의 기술력을 갖추고 있습니다. 이 가운데 AI 기업의 기술력을 판가름하는 것은 훈련입니다.

단순히 거대한 신경망을 갖춘 AI를 만드는 것만으로는 크게 의미가 없습니다. 훈련을 얼마나 '잘' 시키느냐에 따라 AI의 성능은 천차만별이기 때문입니다.

여기서 AI 기업들의 '실력'이 갈립니다. 사실 AI 훈련은 과학보다는 공예에 더 가깝습니다. AI에게 훈련할 데이터 세트를 어떻게 구성할지, 훈련을 몇 회 반복할지('에포크'라고 합니다) 등이 모두 AI의 훈련 종료 후 성능을 결정짓는 변수가 됩니다.

아무리 거대한 AI 모델이라도 데이터의 질이 낮으면 형편없는 결과를 내놓기 마련이고, 훈련을 너무 적게 하거나, 심지어 너무 많게 해도 AI가 망가집니다. 이 외에도 훈련 과정의 다양한 요소가 AI의 '성장'에 영향을 미칩니다. 좋은 AI를 만드는 방법은 여러 차례 시행착오를 거치고 성능 변화를 분석하며 한 계단씩 차근차근 나아가는 겁니다.

그렇기 때문에 지금의 AI 기업들은 모델을 외부에 '공개'하는 것만큼은 극단적으로 꺼립니다. 왜냐하면 지금껏 AI를 훈련하면서 겪었던 모든 시행착오가 그들만의 노하우이자 기술력이기 때문입니다. 처음엔 AI 연구 비영리단체로 시작했던 오픈AI는 최근 '폐쇄 전략'으로 돌아섰습니다. 이 또한 경쟁 기업들이 자사 노하우를 베낄까 우려한 움직임일 가능성이 큽니다.

빅테크 폐쇄 전략 맞서는 오픈소스 '공개 전략'

스태빌리티AI가 개발한 이미지 생성 AI '스테이블 디퓨전'은 오픈소스형 AI 모델의 대표 주자다. [이미지출처=스테이블 디퓨전]

아이러니하게도 이런 '폐쇄 전략'은 극단적으로 '공개 전략'을 표방하는 또 다른 AI에 추월당할 위험이 있습니다. 아예 시작부터 모델의 구성 요소와 세세한 아키텍처, 훈련 방식까지 모조리 공개하는 오픈소스가 대표적인 사례입니다.

구글, 오픈AI에 비해 다소 뒤처졌다는 평가를 받았던 메타 AI가 오픈소스 전략으로 맹추격에 성공한 사례입니다. 대형 언어 생성 모델 라마(Llama)를 오픈소스로 개방함으로써 빠른 진전을 보였습니다. 또 영국 유명 AI 스타트업 '스태빌리티AI'도 오픈소스 전략을 표방함으로써 모델 성능을 증진하고 있습니다.

오픈소스의 강점은 '사용자 커뮤니티'를 구성한다는 것에 있습니다. 사용자들은 자신의 필요에 따라 오픈소스 모델을 변경하거나 개선할 테고, 자신만의 개선법을 다른 사람에게 공유할 겁니다. 이런 방식으로 오픈소스 AI의 성능 개선엔 탄력이 붙을 수 있습니다.

AI 산업 특유의 '문화'도 오픈소스의 발전에 기름을 부을 가능성이 있습니다. 지난 1월 구글 브레인 출신 AI 연구원 데이비드 하는 영국 주간지 '이코노미스트'와 인터뷰에서 "현재 빅테크 중 누구도 AI 기술 선두주자임을 자처하지 못하는 이유는 랩실의 연구 문화 때문"이라며 "모든 기계학습 연구자들은 서로 함께 어울려 다닌다"라고 지적했습니다.

빅 테크부터 스타트업까지 AI 연구자들은 서로의 팁, 노하우를 은밀히 공유하는 문화가 이미 형성돼 있다는 뜻입니다. 이는 아직 AI 산업 자체가 초창기인 탓에, 많은 인재가 여러 기업에 번갈아 가며 고용되기 때문입니다.

딥마인드, 구글, 메타 등 주요 AI 기업들이 모여 있는 영국 런던 킹스크로스 [이미지출처=연합뉴스]

현재 AI 산업의 글로벌 허브로 취급되는 미국 샌프란시스코, 영국 런던의 경우 대부분 AI 기업들이 한 도시 내에 집중돼 있습니다. 유명한 연구자들은 구글, 메타, 마이크로소프트, 오픈AI 등을 한 번씩 거쳤다가 자신만의 스타트업을 차리러 떠나곤 합니다. 이런 상황에선 '기업 비밀'이 제대로 유지될 리 없습니다.

다만, 빅 테크엔 오픈소스가 갖추지 못한 방대한 연구원 네트워크와 최신 슈퍼컴퓨터 인프라를 갖추고 있습니다. AI 개발이 '얼마나 시행착오를 많이 하나'에 달렸다면 빅 테크에 더 유리한 점도 충분히 있습니다. 결국 사용자 커뮤니티의 거대한 질량과 빅 테크의 막대한 자본력 사이 승부가 될 겁니다. 구글이 아직 자신들에게 '해자'가 없음을 인정한 이유입니다.

임주형 기자 skepped@asiae.co.kr

Copyright © 아시아경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?