[김대식의 미래 사피엔스] [42] 오픈소스의 기회와 리스크

김대식 카이스트 교수 2023. 11. 14. 03:05
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

일러스트=조선디자인랩·Midjourney

구글사 시니어 엔지니어가 작성한 내부 보고서가 지난 5월 인터넷에 유출된 사건이 있었다. “생성형 인공지능 시대에는 구글이나 마이크로소프트(MS)가 아닌 오픈소스가 결국 승자가 될 것이다”라는 무척이나 흥미로운 예측이었다.

어렵게 개발한 소프트웨어를 무료로 공유하자는 ‘오픈소스’ 운동. 왜 생성형 인공지능에서는 이렇게 중요한 역할을 하게 된 걸까? 문화적 그리고 사업적 이유가 있겠다. 우선 학습 기반 인공지능 분야에서는 오래전부터 논문과 소프트웨어를 무료로 공유하는 것이 전통으로 자리 잡아왔다. 코드 공유를 금지하는 기업들이 최고의 인공지능 전문가를 영입하기 어려운 이유 중 하나다.

하지만 최근 오픈소스의 영향력은 메타(예전 페이스북)의 비즈니스 전략과도 연관성이 있다. 메타가 뒤늦게 자체 개발한 거대 언어 모델 ‘라마(Llama)’만으로는 MS와 구글과 차별화된 비즈니스가 불가능했기 때문이다. 결국 메타는 라마보다 업그레이드된 ‘라마2′를 무료로 공유하기로 결정한다. 당장 수익을 낼 수 없으니, 생성형 인공지능 생태계를 먼저 장악하겠다는 계획이겠다. 메타만이 아니다. 모자익ML의 ‘MPT-7B’, LMSYS의 ‘Vicuna-13B’, 그리고 가장 최근에는 아부다비 정부가 출시한 ‘팰콘180B’ 역시 무료로 사용 가능하다.

이제 오픈소스로도 개발 가능한 생성형 인공지능은 대학교, 연구소, 그리고 중견·중소 기업들에는 반가운 소식이다. 수백, 수천억을 투자해 거대 언어 모델을 학습시킬 필요가 없으니 말이다. 하지만 사회 전체적인 관점에서 오픈소스는 치명적인 리스크도 가지고 있다. 누구나 적은 비용으로 거대 언어 모델을 학습시킬 수 있다면 개인, 범죄 조직 그리고 ‘불량 국가’들 역시 쉽게 거대 언어 모델을 기반으로 가짜 뉴스와 가짜 데이터를 대량 생산해 낼 수 있으니 말이다. 미국 증권거래위원회(SEC) 게리 겐슬러 위원장이 지난 7월 규제 없는 생성형 인공지능이 새로운 차원의 금융 위기 원인이 될 수 있다고 강력하게 경고한 이유다.

Copyright © 조선일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?