알파고 모먼트 6년…이제는 ‘생성 AI’...드디어 AI로 돈 벌 수 있는 시대 도래

2023. 1. 5. 15:27
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

2023 테크 프리뷰
시작되는 진짜 AI 혁명

“구글 검색은 탄생 이후 가장 큰 도전을 받게 될 것이다.”

< 챗GPT를 만든 샘 올트먼 오픈AI CEO >

인공지능이라는 것이 대중적으로 알려지게 된 사건은 무엇일까? 아마 많은 분들께서 2016년 3월 구글 딥마인드 알파고와 이세돌 선수의 대결을 꼽을 것이다. ‘알파고 모먼트’라고도 부르는데, AI가 가진 엄청난 성능과 잠재력을 대중들이 깨닫게 된 순간이다.

하지만 알파고 모먼트 후 6년. AI는 얼마나 우리의 삶을 바꿔놨을까? 사실 알게 모르게 AI는 엄청난 진보를 이뤘다. 우리 일상생활에서 AI가 적용된 것도 아주 많다. 하지만 알파고 모먼트 때 상상했던 것만큼의 거대한 변화가 이뤄졌는가에 대해서 의문을 가진 사람도 많다. 무엇보다 AI로 엄청난 규모의 성장을 한 기업이 있는가라고 물어본다면 떠오르는 기업이 없는 것도 사실이다. AI 그 자체는 기술이지 사업은 아니기 때문이다.

그런데 지금 실리콘밸리는 AI가 폭발하는 시기가 왔다는 흥분이 가득한 것 같다. 드디어 일반 소비자들이 체감할 수 있는 AI가 나타났다는 것이다. 즉, AI로 돈을 벌 수 있는 시대가 왔다는 거다. 미라클레터에서도 많이 얘기한 ‘생성(Generative) AI’가 그것이다. 이것도 한차례의 유행일까? 아니면 진짜 AI 혁명이 시작되는 걸까?

달리2, 챗GPT 등 생성형 AI를 만든 오픈AI의 샘 올트먼 CEO(우)와 여기에 투자한 사티아 나델라 MS CEO(좌).
트랜스포머에서 GPT-3까지

생성 AI까지 어떻게 왔나

지금의 생성 AI를 만든 것. 시작은 바로 초거대 AI와 트랜스포머(Transformer)다. 트랜스포머는 2017년 구글이 제시한 모델이다. 혹시 BERT나 GPT라는 AI 용어를 들어봤는지 모르겠다. BERT는 Bidirectional Encoder Representations from Transformers의 약자, GPT는 Generative Pre-trained Transformer의 약자다.

모두 트랜스포머를 바탕으로 만들어진 것이다.

트랜스포머는 ‘초거대 AI’를 만들어냈다. AI는 결국 파라메터(매개변수) 개수와 데이터가 제일 중요하다고 할 수 있다. 트랜스포머는 이 파라메터를 늘리면 AI의 능력이 일취월장할 뿐 아니라 데이터를 갖고 학습하는 능력도 발전한다는 것을 보여줬다. 그래서 기업들은 이 파라메터를 수천억 개로 늘려보기로 했다. 가장 대표적인 초거대 AI의 경우 파라메터가 1750억개, 네이버의 하이퍼 클로바는 2040억개의 파라메터를 사용했다고 한다. 이 같은 수천억 개의 매개변수 모델을 갖고 AI를 학습시켜보니 사람들이 깜짝 놀랄 만한 결과가 나오기 시작했다.

그림 그려주고, 인간처럼 대화한다

초거대 AI의 우월한 성능

먼저 AI가 사람의 언어를 훨씬 잘 이해하기 시작했다. 사실 어떻게 이해하는지는 인간도 잘 모른다. 하지만 우리가 사람과 대화하는 것처럼 어떤 맥락 내에서 말을 걸었을 때, AI가 사람이 대화하는 것처럼 대답을 해주기 시작한 것이다.

다음으로 AI는 우리가 부탁하는 대로 그림을 그려주기 시작했다. 예를 들어 ‘사과와 젊은 여성이 있는 그림을 그려줘’라고 하면 과거에 학습했던 그림을 바탕으로 완전히 새로운 그림을 그려주는 것이다. 여기에 ‘사과와 젊은 여성이 있는 그림을 레오나르도 다빈치 스타일로 그려줘’라고 하면 진짜 레오나르도 다빈치가 그렸던 그림처럼 그려주는 것이다.

과거 알파고는 인간이 하는 일을 AI가 더 잘할 수 있다는 것을 보여줬다면 초거대 모델과 생성 AI는 실제 비즈니스에 써먹을 만한 결과물을 내놓고 있는 것이다.

여기에 2022년 11월 말 등장한 오픈AI의 챗(Chat)GPT와 출시 한 달 만에 일매출 10억원을 기록한 렌사 AI의 등장은 생성 AI 붐에 불을 지폈다.

챗GPT는 챗봇 형태로 대화를 할 수 있는 인공지능이다. 다양하고 풍부한 지식을 갖고 있을 뿐 아니라 다양한 과업을 실행해준다. 예를 들어 코딩을 해주거나, 글을 써주는 일을 해준다. 뭔가 도움이 되는 결과물을 생성한다. 렌사 AI는 셀카 사진 20장을 넣으면 다양한 스타일의 초상화 일러스트 100장을 그려주는 앱이다.

GPT3와 ChatGPT의 발전 과정.
세계 최고의 AI 연구기관

오픈AI의 역사 짧게 보기

샘 올트먼이 일론 머스크와 오픈AI를 만든 것은 2015년. 당시 그가 와이콤비네이터의 사장(President)으로 일할 때였다. 당시만 해도 오픈AI는 구글의 인공지능 독점을 반대하면서 뭉친 사람들이 만든 비영리 연구기관이었다. 오픈AI의 핵심 멤버 중 하나는 지금도 오픈AI의 수석사이언티스트인 일리아 수츠케버다. 그는 토론토대에서 제프리 힌튼 교수 밑에서 박사학위를 받았고, 딥러닝 관련된 엄청난 논문과 프로젝트(알파고)에 참여한 슈퍼 연구자다. 2013년부터 구글 브레인에서 일했다. 샘 올트먼과 일리아 수츠케버, 일론 머스크 등이 의기투합한 것은 구글 같은 하나의 회사가 AI를 독점하는 것을 막고 다양한 연구자와 개발자들이 함께 AI를 발전시켜야 한다는 생각 때문이었다. 피터 틸, 레이드 호프만 등 페이팔 마피아가 후원했고 마이크로소프트 클라우드 사업부와 인도 IT 기업 인포시스가 후원사로 참여했다.

일론 머스크가 떠나고

MS의 투자를 받다

2015년은 알파고가 이세돌 기사와 대결을 펼치기 이전이었다. 딥러닝을 통해서 AI 기술이 빠르게 발전하고 있었지만 이에 대한 대중적인 인식은 크지 않았던 시기다. 하지만 구글이 누구보다도 앞서 나가고 있고 독점 수준의 경쟁력을 갖고 있다는 것은 알려져 있었다.

그래서 오픈AI는 이름 그대로 누구나 연구에 참여할 수 있고 AI 기술을 나눌 수 있는 것을 목표로 시작했다. 하지만 오픈AI는 곧 위기에 봉착하는데, AI는 돈 먹는 하마였기 때문이다. AI를 학습시키기 위한 컴퓨팅파워의 중요성은 점점 커져가고 있었고, 일리아 수츠케버 같은 A급 연구자들의 몸값은 어마어마하게 높아서 오픈AI 같은 비영리 단체의 모델로는 한계가 있었다.

그래서 샘 올트먼은 2019년 영리법인으로 오픈AI를 전환하고 마이크로소프트로부터 10억달러의 투자를 받는다.

나중에 알려진 것으로는 이 10억달러 투자의 대부분은 MS의 애저 클라우드를 제공하는 형태였다. 하지만 일론 머스크는 이해 상충 문제가 있다면서 MS의 투자를 받을 때쯤 오픈AI에서 물러난다.

오픈AI가 만든 것

코딩하는 AI, 그림 그리는 AI

MS의 투자를 받을 무렵, 오픈AI는 차례차례 연구 성과를 내기 시작했는데 2019년 2월에 GPT-2가 나왔고, 2020년에 GPT-3가 나왔다. 두 가지는 그냥 언어를 학습한 AI라고 보면 된다. 2021년 1월에 DALL-E가 처음 등장했는데 이건 언어를 그림으로 바꿔주는 AI다. 사실 여기까지는 ‘신기하다’는 정도의 결과물이었다. 2022년쯤부터 일반인들을 깜짝 놀라게 하는 인공지능들이 오픈AI에서 나오기 시작했다.

첫 번째는 2022년 초에 나온 DALL-E 2다. 기존의 DALL-E가 장난스러운 수준의 그림을 그려줬다면 DALL-E 2부터는 전문 일러스트레이터 수준의 그림이 나오기 시작했다. 코딩을 해주는 AI인 코덱스(CODEX)도 마찬가지다. 코덱스는 마이크로소프트가 2018년 인수한 개발자 커뮤니티인 깃헙의 코드를 학습해 나온 것으로 2021년 중순에 세상에 등장했다. 이 코덱스는 깃헙 코파일럿이라는 서비스로 서비스되고 있다.

세상을 깜짝 놀라게 한

ChatGPT의 등장

그리고 2022년 11월 세상을 깜짝 놀라게 하는 ChatGPT가 나왔다. ChatGPT는 출시 2주 만에 사용자가 200만명에 도달한 것으로 추정된다.

ChatGPT는 IntructGPT라는 2022년 1월에 나온 모델의 동생인데, 2020년에 나온 GPT-3를 훈련시킨 모델이다.

RLHF(Reinforcement Learning from Human Feedback)를 사용해 훈련시켰다. 말 그대로 사람의 피드백으로 강화 학습을 시켰다는 뜻이다. GPT-3는 학습을 거쳐 어떤 문장에 대해서 다음에 올 확률이 가장 높은 문장을 만들어주는 것이 기본 원리다.

“1+1은 무엇인가?”

이런 질문의 답을 얻는다고 할 때, 우리가 생각하는 지능은 ‘1’이란 무엇이고 ‘+(덧셈)’란 무엇인가의 수학적 개념을 알고 ‘2’라는 결과를 도출하는 것이다. 하지만 AI가 인터넷상의 수많은 문장들을 학습하다 보면 “1+1은 무엇인가?”라는 문장의 뒤에는 “답은 2입니다”라는 문장이 나오는 경우가 확률적으로 가장 많이 나올 것이다. GPT-3는 이 같은 방식으로 작동하는 인공지능이다.

챗GPT로 서평을 부탁하자 AI는 그럴듯한 영문 서평을 써줬다. (ChatGPT 제공)
사람의 피드백을 반영해서

인간 같은 챗봇 AI를 만들다

그런데 인간의 언어는 단순한 사칙연산이나 논리학이 아니라 좀 더 복잡한 요소들이 개입한다.

또, 인간다운 말투라는 것도 있다. 문화적인 요소도 많이 개입한다. 단답으로 1회 주고받는 것이 아니라 서로 주고받는 것이 반복되는 대화(Conversation)의 경우에는 나의 잘못을 인정하거나, 상대의 잘못을 지적하는 경우가 발생한다. InstructGPT가 사용한 RLHF는 사람의 피드백을 반영해서 가장 사람이 말하는 것 같은 결과물에 가점을 줘서 학습을 시켰다. 당연히 그 결과물은 더 사람 같아졌다. 사람의 피드백을 반영했다는 것은 결국 사람이 노가다(?)를 했다는 것이다. InstructGPT는 AI 데이터 전문 업체인 스케일AI와 업워크(용역 외주 사이트)를 통해 40개의 하청 업체를 사용했다. 즉, 꽤 많은 수의 사람이 동원됐다고 예상할 수 있다. 참고로 우리가 ChatGPT나 렌사 AI 등을 사용하면서 남기는 피드백은 모두 AI의 학습으로 사용된다.

인간 같은 AI에 매료된 사람들

ChatGPT가 J커브를 그린 이유

ChatGPT는 InstructGPT에서 한발 더 나아가 연속적인 대화가 이뤄지는 듯한 인상을 줄 수 있는 방향으로 학습을 강화했다. 나의 잘못을 인정하거나, 상대의 잘못을 지적하는 것이 대표적이다.

우리가 ChatGPT를 사용할 때 ‘사람인 것 같다’고 느끼는 이유다. AI가 코딩을 해준다든지, 어떤 지식에 대한 결과물을 내놓는다든지(검색) 하는 것들은 사실 이전의 오픈AI가 차곡차곡 만들어온 기능이었다.

ChatGPT가 엄청난 바이럴을 일으키고 있는 이유는 누구나 사용해볼 수 있다는 점 때문이다. 누구나 AI에 대한 호기심이 있고, 이걸 한 번 써보고 싶어 한다. 그런데 ChatGPT는 채팅 형태로 이것을 체험해볼 수 있게 해준다. 그리고 이 경험을 소셜미디어에 공유할 수 있다. 이렇게 보면 ChatGPT는 단순한 모델을 넘어 훌륭한 AI 프로덕트(제품)라고 볼 수 있다. 이 점이 기존에 나왔던 AI와의 가장 큰 차이점이 아닐까.

스테이블 디퓨전과

오픈소스가 이끄는 AI 혁명

2022년 초까지만 해도 초거대 AI와 생성 AI는 일부 대기업의 것이었다. 구글, 마이크로소프트가 투자해 GPT를 만든 오픈AI, 메타, 엔비디아 같은 대기업이다.

수천억 개의 파라메터를 가진 AI를 만들어서 이를 학습시키려면 천문학적인 돈이 필요하다. AI 학습을 하는 데 쓰이는 것이 대표적으로 엔비디아에서 만드는 GPU다.

그런데 이 GPU를 사용하는 것이 엄청나게 비싸다. 이것을 구매해서 직접 보유하는 것도 비싸고, 이걸 보유한 기업으로부터 빌려 쓰는 것도 엄청나게 비싸다. 직접 구매해서 보유한다면 1000억원대, 빌려 쓴다고 해도 연간 수십억원을 써야 한다. 대부분의 스타트업들은 엄두도 내지 못한 일이었다.

그런데 2022년 8월 등장한 ‘스테이블 디퓨전(Stable Diffusion)’이라는 모델은 말 그대로 AI 시장의 지각변동을 가져왔다. 스테이블 디퓨전이 등장하기 전 달리2와 미드저니가 있었다. 달리2의 경우 텍스트를 이미지로 만드는 서비스를 만든 선구자였고, 미드저니는 이 서비스를 디스코드를 통해서 매우 우수한 퀄리티로 제공하면서 화제를 모았다. 그런데 스테이블 디퓨전은 8월 자신들의 모델을 오픈소스로 풀어버렸다.

값비싼 AI 모델 오픈소스로 제공

파인 튜닝만 거치면 누구나 사업화 가능

초거대 AI를 갖고 모델을 만드는 데는 엄청난 돈이 필요하다.

그런데 스테이블 디퓨전의 모델은 만들어져 있고 오픈소스다. 약간의 사용료(API)를 내야 하고, 추가 학습을 시킬 필요도 있지만 처음부터 모델을 만드는 데 사용되는 비용을 감안하면 사업을 거저 한다고 할 수 있다. 스테이블 디퓨전의 모델을 가져와서 고객의 필요에 맞춰 약간의 수정(파인 튜닝)만 거치면 쓸 만한 서비스가 만들어지는 것이다.

예를 들어 노블AI는 애니메이션 일러스트를 학습해서 만들어진 모델이다. 하지만 고객마다 선호하는 그림의 형태가 다르다.

예를 들어 아이들을 고객으로 하는 서비스라면 아이들이 선호하는 형태의 그림이 있을 것이다. 밝고, 명랑하고, 따듯한 느낌의 그림들이다. 그런 그림들을 학습하면 AI는 거기에 딱 맞는 그림들을 그려낼 것이다. 사업에 대한 아이디어만 있으면 바로 유료화할 수 있는 서비스가 만들어지는 것이다.

생성 AI가 미치는 파급 효과

게임 개발 비용 낮춘다

생성 AI가 혁명적인 이유는 학습만 시키면 AI가 월등한 퀄리티로 뭔가를 만들어낸다는 것이다. 최근 생성 AI가 가장 큰 영향을 끼칠 산업으로 ‘게임’이 꼽히고 있다. 생성 AI로 게임에 필요한 여러 그림을 만들어낼 수 있고, 심지어 3D 모델도 만들 수 있다. 하나하나 그림을 그리고 3D 모델을 만들어야 했던 것에 비하면 엄청난 변화가 만들어지게 될 것이다. 게임 개발에 들어가는 비용이 엄청나게 줄어들고, 소규모 게임 개발이 훨씬 활성화될 것이다. 스테이블 디퓨전을 만드는 스태빌리티AI는 한발 더 앞서간다. 모델을 오픈소스로 공개하는 것뿐 아니라 스타트업들이 GPU를 사용할 수 있도록 지원해준다. 인공지능 학습은 결국 클라우드(컴퓨팅파워) 형태로 제공이 되는데, 우리가 직접 GPU를 구매하는 것이 아니라 필요한 만큼만 쓰고 사용료를 지불한다는 뜻이다.

이 클라우드 사용료를 스태빌리티AI에서 대신 내주면 스타트업이 모델을 개발하는 데 필요한 비용이 훨씬 줄어들게 된다. 그뿐 아니라 AI 오픈소스 프로젝트에는 학습에 필요한 데이터를 제공하는 경우도 있다.

유니콘이 된 스태빌리티AI

“폭발하는 AI 생태계”

모델, 데이터, 컴퓨팅파워. AI 스타트업의 장벽이라고 할 수 있는 세 가지가 모두 해결된다면 결국 창조적으로 시장을 찾아내고 이를 어떻게 실행하느냐의 문제만 남게 된다. 실제로 스테이블 디퓨전이 공개된 이후 이를 사용한 서비스와 앱은 폭발적으로 늘어나고 있다. 오픈소스가 가진 엄청난 힘이다. 스태빌리티AI가 2022년 10월 1억달러 규모 투자를 받고 1조원 가치의 유니콘 기업이 된 것은 이런 배경 때문이다. 스태빌리티AI가 폭발하는 AI 시장에서 생태계의 중심에 있을 것이라는 기대감 때문이다. 스태빌리티AI의 경쟁사라고 할 수 있는 오픈AI의 샘 올트먼은 한 강연에서 이렇게 말했다.

“AI로 인해 구글 검색은 앞으로 몇 년 내에 최초로 가장 큰 도전을 받게 될 것이다.”

[이덕주 기자]

Copyright © 매경이코노미. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?