[여현덕의 AI Thinking] 챗 GPT 출시 1년, 비즈니스에서 모방과 창조

생성형 AI, 다양한 영역 생산성 혁명
방대한 콘텐츠 모방→창작으로 전환
경제적 가치 창출… 개인정보 등 문제
기업들 고객 데이터 신뢰 구축 관건

구글이 지난 9일 생성형 AI 검색 기능 서치랩스(Search Labs)를 한국에도 적용한다고 발표했다. 구글 검색창에서 링크를 찾아주던 방식이 아니라 새로운 콘텐츠를 제공해주는 생성형 AI(Generative AI)를 도입한 것이다. 사실 AI의 수준을 파격적으로 높인 생성형 AI의 기초는 구글 브레인(Google Brain)이 먼저 닦았다. 구글 브레인이 2017년 트랜스포머(transformer)를 발표하고 머뭇거리는 사이에 오픈 AI가 챗GPT를 세상에 내놓은 것이다. 챗GPT, 달리, 렌사 등 소비자용 어플이 연이어 출시됐고 코드, 이미지, 비디오, 오디오, 3D 모델 등 다양한 영역에서 생산성 혁명의 불이 붙었다.

생성형 AI는 일일이 지시하지 않아도 자동으로 창작을 가능케 한다. 규모와 능력 면에서 볼 때 방대한 텍스트 학습 데이터에 기반한 대규모 언어모델(LLM)을 개발해 초거대 AI의 시대를 연 것이다. 파괴적 혁신의 문을 연 것이다. 예를 들어, 광고 업계에서 생성형 AI를 도입하면 기계가 사람 대신 참신한 광고 문구와 이미지를 단 몇 초 만에 생성할 수 있다. 벌써 기업과 벤처캐피털은 생성형 AI가 가져다줄 수익에 눈독을 들이고 있다. 구글은 스타트업 앤스로픽(Anthropic)에 3억 달러를 투자했고, 마이크로소프트(MS)가 오픈 AI에만 100억 달러를 투자했다.

바야흐로, 생성형 AI의 세상이 열렸다. 그런데, 이와 같은 거대한 혁신과 변화를 가능케 한 생성형 AI의 시대의 내면을 자세히 들여다보면 거대한 모방을 창작으로 전환하는 트랜스포머임을 알 수 있다. 사람의 창작 과정을 흉내 낸다는 점에서 이전의 AI와 본질적으로 같다. 생성형 AI는 인식과 분류를 넘어서 타인이 만들어놓은 데이터를 순식간에 모아서 재구성하는 트랜스포머 AI로 어떤 면에서는 무수히 많은 콘텐츠를 순식간에 ‘모방+조합’하므로 조합 이상(창작?)으로 보이게 된다. 딥러닝을 넘어서 모방을 창작으로 전환하는 기술은 바로 맥락 파악, 관계 추적, 결과 예측 능력을 크게 강화했다. 단순한 구현 기술에 머물러 있었던 AI가 인간의 협업자요, 공동 창조자로 승격한 것이다.

생성형 AI의 발전과 함께 데이터가 새로운 ‘통화’로 부상하면서 데이터를 확보하고 합성하는 일이 경제적 가치를 창출하는 시대가 됐다. 사진은 챗GPT를 이용해 이런 트렌드를 시각화한 이미지. 출처 : 새로운 통화로서 인공지능(챗GPT에서 생성)

아리스토텔레스는“모방은 창조의 어머니”라고 했다. 어쩌면 모든 창조는 모방과 조합에서 출발하는지도 모른다. 윌리엄 더건 컬럼비아대 교수는 순수한 창조를 믿지 않았다. 그의 저서 ‘전략적 직관(Strategic Intuition)’에서“애플을 만든 스티브 잡스와 마이크로소프트를 세운 빌 게이츠는 결코 새로운 뭔가를 발명한 것이 없다. 그들은 아이디어를 모두 훔쳤다. 밖으로 나가 끊임없이 뭔가를 검색하고 찾아 최선의 것이 발견되면 가져와서 조합했을 뿐이다. 그것이 그들이 한 창조”라고 진단했다. 엄밀하게는 창조가 아니라 발견과 조합이라는 것이다.

위와 같은 시각에서 챗GPT의 방식을 엄밀히 관찰해보면 창작을 한 것이 아니라, 방대한 데이터를 갈아 넣고 분류하고 모방, 조합한 것이다. 그런데 생성형 AI는 집단지성의 원리를 차용하고 있어서 조합에 가치를 더하는 것이다. 너무나 많은 데이터가 들어가서 누구의 콘텐츠인지 알지 못하는 경지, 즉 예술의 경지에 오른 기술은 아닐까.

최고의 독서왕은 1년에 책을 몇 권이나 읽을까. 100권? 아무리 초인이라도 연간 1000권 이상을 읽기는 어려울 것이다. 인터넷에 가장 많은 책을 읽은 사람이 누구인지를 물으면 몇 명이 등장한다. 정확히 확인하기는 어렵다는 전제하에 ‘스탈린’이라는 대답도 나온다. 크렘린 도서관에는 그의 필체로 주석이 달린 2만권의 책이 발견됐기 때문이다. 1980년대에 활동한 인도의 영적 지도자인 라즈니시는 15만 권 이상의 책을 읽었다는 링크도 나온다. 조선시대 백곡 김득신이 읽은 책을 기록한 ‘독수기(讀數記)’를 보면 입이 떡 벌어진다. 그는 사마천의 ‘사기열전·백이열전’을 1억1만3000번 읽었고 ‘노자전’을 2만 번 읽었으며, ‘중용서’는 1만8000번 읽었다고 했다. 1만4000번 이상 읽은 책만 36편이라니 기가 찰 노릇이다. 그리하여 “책 5000권을 읽지 않은 자는 내 방에 들어 오지 마라”는 말까지 남겼을 정도다. 실학자 정약용은 이분이 효자로 알려져 있으므로 부모님도 모시고 잠도 자야 하므로 사실상 불가능한 숫자라고 반박한다.

아무리 초인이라도 인간은 1억 권을 읽을 수 없다. 읽었다고 하더라도 한 달이 지나면 잊어버리기 마련이다. 그런데 인공지능은 1000억 개가 넘는 자료를 읽고 저장해 1750억 개의 파라미터(GPT-3)를 구성하기 때문에 인간의 상상력을 초월한다. AI가 이렇게 많은 데이터를 학습하고 작문하기에 놀랍고 위대한 것일까. 위대한 것은 모방도 창작으로 용인되는 것일까. 아니면 인류의 지식 데이터를 섭렵한 집단지성의 힘이 깃들어 있어서 위대한 창작이 되는 것일까. 생성형 AI의 등장과 발전은 결국 인간의 능력을 증강하는 역할을 하게 된다는 가정 때문에 수용되는 것일까. 인간이 이렇게 모방하고 조합하면 당장 문제가 될 것이나 AI가 하면 초거대이고 유적 존재(species being)에 이를 만큼 집단지성의 힘이 작용하기에 시대의 영웅이 되는 것일까. 우리는 이중의 잣대 속에 살아가고 있는지도 모른다.

딜로이트에 따르면 생성형 AI의 발전으로 데이터가 새로운 ‘통화’로 부상하며 데이터를 확보하거나 합성하는 것은 새로운 경제적 가치를 창출하는 시대다. 제품, 서비스, 소통을 실시간으로 제공받으니 편리하다. 생성형 AI은 개인 비서나 소셜미디어 마케팅을 가능케 해주니 유용하다. 빠른 속도로 코드를 작성하고 이메일 발송도 가능케 해주니 시간을 아낄 수 있다. 자동화된 일정 관리, 행정비서, 콘텐츠 요약으로 창작이 쉬워지니 노동력은 절감된다. 광고 문구, 이미지 창작, 작곡, 영상 생성 등 모두 삽시간에 이루어지니 창조적이고 예술적이다. 시뮬레이션, 3D 모델링, 캠페인, 재난 대응 관리도 가능하다.

바로 이런 경제적 가치 때문에 기업이 챗GPT를 직접 사용하는 경우 지적 재산의 문제, 오픈소스 라이센스 문제, 개인 정보 보호 문제 등이 대두된다. 상업화로 향하고 있는 이 시대의 생성형 AI는 신뢰 구축이 관건이다. 기업들의 생성형 AI 도입이 일반화되고 돈을 벌기 시작하면 본격적 검증이 시작될 것이다. 오늘날 생성형 AI 벤더들이 신뢰 장치를 높여야 하는 이유이다. 대규모 고객 데이터를 확보하고 이를 사업화하는 기업들은 데이터 품질, 투명성, 공정성, 안전성, 무결성 등 신뢰 장치를 선제적으로 구축·강화해야 함은 아무리 강조해도 지나침이 없을 것이다.

여현덕 카이스트 기술경영전문대학원 교수

이 기사에 대해 어떻게 생각하시나요?

국민일보에서 직접 확인하세요. 해당 언론사로 이동합니다.

사설칼럼

[여현덕의 AI Thinking] 챗 GPT 출시 1년, 비즈니스에서 모방과 창조