[ET] ‘대답 척척’ 초거대 AI ‘챗GPT’…구글링 저리 가라?

■ 프로그램명 : 통합뉴스룸ET
■ 코너명 : 호모 이코노미쿠스
■ 방송시간 : 12월13일(화) 17:50~18:25 KBS2
■ 출연자 : 김덕진 미래사회IT연구소 소장
■ <통합뉴스룸ET> 홈페이지
https://news.kbs.co.kr/vod/program.do?bcd=0076&ref=pMenu#20221213&1

[앵커]
경제하는 사람들의 마음을 읽어보는 호모 이코노미쿠스입니다.

[녹취]
"5분 후 회의입니다"

[앵커]
이렇게 단순히 일정만 알려주는 정도의 AI 비서는 이제 명함도 못 내밀 처지입니다.

[녹취]
"당신을 사랑하듯이 누굴 사랑해본 적 없어"
"나도... 우린 이제 사랑을 배운 거야"

[앵커]
연인과 대화하듯 사랑의 감정을 나누기도 하고, 이보다 더 놀라운 AI까지 등장했다고 합니다. IT 업계의 뜨거운 화두 초거대 AI, 그 위험과 한계까지 함께 짚어보겠습니다. 미래사회IT연구소 김덕진 소장 나오셨습니다. 소장님, 반갑습니다.

[답변]
안녕하세요? 반갑습니다.

[앵커]
이제는 AI라고 해도 그렇게 많이 놀랍지는 않아요. 요 몇 년 새 하도 이것도 한다 저것도 한다는데 GPT라는 이름이 붙은 챗봇? 챗 AI? 얘는 정말 놀랄 만한 아이입니까?

[답변]
실제로 테슬라의 창업자인 일론 머스크도 이번 챗GPT를 보고 보시는 것처럼 정말 위험하리만큼 강력한 AI다 이렇게 얘기를 했어요. 실제 챗GPT는 오픈AI에서 만든 고성능 AI, 언어 모델인데요. 기존에 GPT3 버전이 있었는데 그게 조금 더 업그레이드된 3.5버전이라고 보시면 될 거 같고요. 이런 것들이 이른바 요즘에 가장 화두가 되고 있는 초거대 AI 종류 중에 하나다라고 설명을 드릴 수 있을 거 같아요.

[앵커]
초거대 AI라는 게 거대하다는 게 어떤 의미예요, 정확히? 용량이 거대하다는 건지, 학습 능력이 거대하다는 건지.

[답변]
초거대 AI, 말씀하신 두 가지가 다라고 보시면 될 거 같은데요. 일단 데이터양도 엄청나지만 가장 중요한 것 중에 하나는 인간의 뇌랑 거의 비슷해지려고 하는 거예요. 그래서 인간의 뇌에 정말 많은 신경세포가 있거든요. 그 신경세포처럼 수많은 파라미터값들이 들어가가지고 그 안에서 인간처럼 사고학습 판단할 수 있게 만들어주는 이러한 인공지능을 목표로 하는 것들이 초거대 인공지능이라고 보시면 될 거 같고요. 그래서 뭔가 사람이 질문을 했을 때 정말 사람이 대답하는 것처럼 뭔가 대답을 하거나 행동을 하거나 글을 써주는 이런 것들이 최근에 연구되고 있는 초거대 AI라고 볼 수 있을 거 같습니다.

[앵커]
우리가 사실 휴대전화 속에 있는 시리 이런 AI하고도 대화를 하다 보면 한 세 마디, 네 마디 하면 그다음부터는 엉뚱한 소리 하잖아요. 지금의 나온 챗GPT 얘는 다릅니까?

[답변]
초거대 AI나 챗GPT의 학습방식을 설명 드려야 될 거 같은데요. 예를 들면 예전에 말씀하신 것처럼 왜 두세 마디 하면 좀 이상해졌느냐? 한국의 수도는 어디인가요? 만약에 질문을 하면 예전에는 한국이 어떤 의미인지도 컴퓨터가 이해하려 그랬고 수도도 어떤 의미인지 이해하려 그랬고 어딘가요도 이해하려고 했어요. 지금은 어떤 방식이냐면 인터넷에 있는 수많은 글들을 통으로 학습합니다. 그랬더니 대부분의 글이 한국의 수도가 서울이다라고 표현이 돼 있는 거예요. 그러면 한국의 수도 다음에 서울이 확률적으로 높이 나올 것이다라고 해서 서울이라는 걸 답변으로 주는 방식이라고 보시면 될 거 같아요. 쉽게 말하면 영어에서 우리가 빈칸 채우기 하듯이 한 칸 한 칸 채우는데 이게 맞다 틀리다를 확률상으로 보는 이런 방식이라고 보시면 될 거 같습니다.

[앵커]
그러니까 어떤 단어의 의미뿐만 아니라 전체적인 문맥까지 다 이해를 해서 답을 하는 수준까지 왔다라고 보는 거 같은데 그러면 우리 똑똑한 챗GPT 한번 직접 질문 던져볼까요?

[답변]
네, 그러시죠.

[앵커]
제가 일단 제 머릿속에 있는 단어 중 가장 어려운 단어를 하나 가져왔습니다, 양자역학. 반말로 물어봐도 되나요? 양자역학에 대해 쉽게 설명해 줘.

[답변]
저렇게 보게 되면 저렇게 질문을 하면 챗GPT가 보시는 것처럼 정말 매끄러운 형태의 문장들을 쓰는 걸 볼 수 있습니다. 저게 예를 들면 양자역학에 대해서 질문했기 때문에 양자역학에 대해서 그다음으로 나오는. 확률상으로 다음으로 나오는 빈칸을 계속 채우면서 저런 맥락을 만들었다고 보시면 될 거 같아요.

[앵커]
하나 더 던져볼게요. 그러면 양자역학에 대한 아인슈타인의 생각은 어땠을까? 이러면 뭐라고 답이 나올까요?

[답변]
말씀해 주신 것처럼 그렇게 저희가 챗GPT한테 물어보면 답변을 저런 식으로 해 주는 거죠. 아인슈타인과 양자역학이라고 하는 두 단어가 들어간 수많은 인터넷 글들을 학습한 다음에 그 안에서 맥락을 주는 건데요. 그런데 앞에 글이랑 뒤에 글 자세히 보시면 얘가 아까도 저희가 양자역학에 대해서 설명해달라 그랬잖아요. 설명이 아니라 계속 뭔가 돌아 돌아 빙글빙글 맥락에 대한 이야기만 하는 거 같은 느낌 아마 드셨을 거예요. 그게 왜 그러냐면 아까 앵커님께서 그러면 이 GPT가 모든 내용을 이해하고 있느냐? 그렇지 않아요. 이해하는 게 아니라 그냥 그다음에 나오는 단어들을 확률상으로 뿌려주는 겁니다. 그걸 보고 사람들이 어? 이거 정답이네. 마치 우리가 찍기를 하는 것처럼 이렇게 되는 건데요. 이런 것들이 학습을 하면서 조금 우리에게 보여줄 때 이건 충분히 의미가 있네라고 거꾸로 보여주는 형태라고 생각하시면 될 거 같습니다.

[앵커]
그러니까 인터넷에 돌아다니는 정보를 약간 짜깁기해서 문서화하는 그런 느낌도 있어서. 혹시 잘못된 정보를 그냥 전문가스럽게 표현만 그렇게 한 게 아닌가. 이거 정말 100% 믿을 수 있는 정보인가 하는 생각도 들거든요.

[답변]
그래서 제가 생각할 때는 약간 이 챗GPT가 완벽한 똑똑한 전문가가 등장했다기보다 신입사원이나 인턴이 등장해서 제가 궁금해하는 것들을 정리해서 갖고 오면 그거를 인간이 컨펌을 하고 사람이 이건 아니야라고 하면 수정, 보완하는. 그런데 이번에 챗GPT는 좀 똑똑한 게 제가 만약에 이게 아니야라고 하면 그걸 또 빠르게 학습해서 반영을 해 줍니다. 결국에는 인간이 한 번 더 모니터링을 해야 되고요. 그렇기 때문에 여기에서 나온 결과물만 믿는다고 하면 충분히 문제가 될 수 있는 부분들도 있다 이런 얘기도 드릴 수 있을 거 같습니다.

[앵커]
많은 사람이 안고 있는 고민 중에 하나가 글쓰기. 이거 인공지능이 과연 잘할 수 있을 것인가가 또 업계의 화두였잖아요. 글쓰기도 잘해요?

[답변]
실제로 이제 우리나라 수능처럼 미국의 대학과정 인증시험이 있는데 거기에서 에세이. 우리가 짧은 글짓기를 물어봐요. 실제 폭풍의 언덕이라고 하는 주제를 주고 다섯 단락의 에세이를 적어줘라고 했거든요. 실제로 생각보다 꽤 잘 작성을 했더라고요.

[앵커]
내가 쓴 것보다 더 잘 써요?

[답변]
제가 볼 때는 한 중학생 정도 이상은 쓰는 거 같은데 그런데 내용을 보면 한 다섯 맥락 중에 한두 문장이나 단어 조금 이상한 부분이 있어서 그거는 우리가 꼭 수능 글짓기 선생님처럼 고쳐줘야 되는 이런 형태들이 있죠.

[앵커]
이렇게 되면 대학가에서 자기 논문을 이런 AI한테 맡기는 경우도 생길 텐데 교수님이 그거 보면서 인간이 쓴 건지 AI가 쓴 건지 이거 구분할 수 있을까요?

[답변]
이미 말씀하신 것처럼 유발 하라리 사피엔스 같은 경우에도 이번에 개정판이 나올 때 서론을 AI가 쓴 걸 보고 하라리가 되게 놀랐다 이런 얘기, 유발 하라리도. 그런 얘기들이 나오고 있거든요. 그 얘기는 무슨 말이냐면 결국에는 지금 이미 논문을 만들어주는 AI들은 있고요. 역으로 그런 것들이 금지되는 게 정책적으로 나와야 되는 상황이다 이렇게 설명 드릴 수도 있을 거 같습니다.

[앵커]
이런 전문적인 글 말고요. 저는 사실 메일 쓰는 거 귀찮아하는 편인데 우리 ET가 송년회를 부득이하게 연기를 해야 되는 그런 상황이 발생했습니다. 이거 공지 메일 이런 거 챗한테 부탁해도 거대한 AI가 할 수 있습니까?

[답변]
충분히 우리가 근하신년이나 이런 것처럼 패턴화 되어 있는 거니까 될 거 같아요. 한번 질문을 해보시죠. 보시면 ET 송년회가 부득이하게 연기됐다라고 메일 쓴다면? 이라고 질문을 했을 때 저기 있는 것처럼 대답을 하게 되는데 일단 저기에 ET 송년회라고 했기 때문에 저것을 가지고 일반적인 포맷의 형태로 저렇게 메일을 써주는 것도 볼 수 있습니다.

[앵커]
그런데 아주 엉뚱한 답변을 하는 경우도 가끔 있다고 들었어요. 예를 들면 이순신이 누구인가를 입력을 했더니 조선의 대통령 이렇게 답을 했다고도 하는데. 그래서 바보 아닌가 이런 말을 하는 분도 계시더라고요.

[답변]
두 가지 이유가 있는데요. 첫 번째는 챗GPT 자체가 기본적으로 영어 데이터가 학습량이 훨씬 많기 때문에 영어가 아닌 한국어로 질문했을 때 학습에 대한 한계가 있고요. 두 번째는 그런 지금 역사적인 데이터뿐만 아니라 최근에 트렌드를 물어볼 때도 안 될 때가 있어요. 지금 이게 베타 버전인데 2021년까지 정도 학습된 걸로 알려져 있거든요. 그다음 데이터들은 조금 오류가 있는 부분도 있고 그래서 저희가 고쳐나가면서 써야 되는 상황이라고 볼 수 있을 거 같습니다.

[앵커]
이렇게 모든 걸 다 궁금한 거 알려주는 챗, 거대한 AI가 등장했으면 앞으로 구글은 어떻게 되는 건가요? 떨고 있을 거 같은데요.

[답변]
그래서 어떤 분들은 구글 검색의 시대가 저물고 이러한 전문가 형태의 어떤 AI가 나오는 것이 아닌가라고 하지만 제가 볼 때 이 두 개가 같이 병행될 수 있을 거라고 봐요. 왜냐면 새로운 정보에 대해서 사람들의 관심을 보여주는 게 검색이고 뭔가 전문가적인 정보 혹은 예전에 있었던 걸 정리해서 보여주는 형태가 지금의 어떤 생성형 초거대 인공지능이기 때문에 이 두 개를 병행해서 쓴다면 사용자 입장에서 훨씬 더 낫겠다고 보고요. 그리고 구글 입장에서는 당연히 조금이지만 본인들의 점유율을 뺏길 수 있는 부분은 분명히 존재한다고 볼 수 있을 거 같습니다.

[앵커]
지금까지는 무료로 이거를 사용하고 있는 거 같은데 이 회사는 어떻게 해서 돈을 번다는 계획입니까?

[답변]
지금은 베타 버전인 상황이고요. 이런 사용을 얼만큼 할 때마다 API당 얼마. 아니면 사용당 얼마 이런 식으로 향후에는 비용이 예측될 것으로 보여요. 그런데 이제 지금이 GPT3.5인데 말씀드렸던 대로 그다음 버전인 GPT4가 내년에 출시를 지금 대기하고 있거든요. 그래서 제가 볼 때 이번에 나온 건 GPT4를 앞에 두고 약간 본인들의 실력을 보여주려는 하나의 마케팅이 아닐까 이렇게 예상해볼 수도 있을 거 같습니다.

[앵커]
정말 AI가 못하는 건 뭘까요? 인간은 뭘 해야 차별성을 가질 수 있을까요? 이런 고민까지 하게 되는 시간이었습니다. 지금까지 김덕진 소장 함께했습니다. 오늘 말씀 고맙습니다.

https://news.kbs.co.kr/special/danuri/2022/intro.html

KBS

이 기사에 대해 어떻게 생각하시나요?

KBS에서 직접 확인하세요. 해당 언론사로 이동합니다.