더 강력해진 '챗GPT4', 무엇이 달라졌을까

드디어 왔다, 챗GPT4. 지난해 11월 이후 넉 달 동안 많은 사람들이 그 어떤 슈퍼스타보다도 '다음 앨범 들고 컴백'을 기다려온 존재다.
왜 다음을 기다렸나?
무엇이 달라졌을까
이를테면 너무너무 밥 하기 싫고 식욕도 애매한 날, 냉장고를 열고 사진을 찍어서 챗GPT4에게 보여준다.(채팅창으로 업로드해 준다) 그러면 그가 냉장고를 파먹을 수 있는 몇 가지 간단한 조리법을 바로 말해줄 것이다. 냉장고 안의 재료 이미지들을 보고, 그동안 학습해 둔 방대한 데이터 안에서 적절한 레시피를 찾아내고 정리해 알아듣기 쉬운 말로 알려주는 것이다. 즉, 말뿐만 아니라 다른 모드, '멀티 모드'가 가능해진 것이다.
하지만 지금 일반 사용자가 사용할 수 있는 채팅창에는 이미지 업로드 버튼이 없다. 지나친 트래픽이 두려웠던 건지, OpenAI사가 막아두었다. 대신 OpenAI사는 챗GPT4의 이 기능을 이용해 시각장애인들이 매우 유용하게 이용할 수 있을 서비스 '내 눈이 되어줘(Be My Eyes)'를 구축해 놓았다. 시각장애가 있어 직접 볼 수 없는 영상이나 사진에 대해 챗GPT4가 접목된 '내 눈이 되어줘'가 상세한 설명을 들려줄 수 있다.
이 부분은 바로 체험하기 어렵다 해도, 챗GPT4를 사용해 보면 3.5보다 확실히 똑똑해졌다는 느낌을 받는다. 특히 미국인보다 한국인들이 훨씬 더 그렇게 생각하게 될 것이다. 이미지 처리 기능 다음으로 두드러진 발전은 사용할 수 있는 언어의 발전이다. 영어 외의 다른 언어 데이터가 매우 빈약했던 3.5까지와 달리, 챗GPT4는 한국어가 많이 늘었다. 한국어만 많이 는 게 아니라 26개 언어가 확 늘었다.
지난달 초, '친절한 경제'에서 기자가 챗GPT를 소개할 때 3.5의 한국어 실력을 보여주기 위해, 우리말로 "대한민국은 누가 건국했지?"라고 물었다. "나이지리아 파견 군사관인 김정일이 건국하였습니다."란 답변이 돌아왔다.(전체적인 문장도 비문이었다) 또다시 물어보자 뭔가 이게 아니라고 '느꼈는지', "김정일은 한국의 첫 대통령이지만 건국한 것은 한국 국민이었습니다."라고 뭔가 감성을 건드리는 답변을 내놓긴 했다. 그래도 그 정도로는 틀려도 보통 틀린 게 아니어서 감성이 건드려지지 않았다.
좀 더 설명하면
사실을 답할 가능성도 40% 정도 더 커졌다. 하기 싫은 말을 시키는 건 더욱 어렵게 됐다. 챗GPT3.5가 큰 인기를 끌었던 또 하나의 이유는 과거의 언어생성형 인공지능과 달리 혐오나 차별적인 표현들을 하지 않는 점잖은 AI라는 점이었다. 챗GPT3.5가 그럴 수 있었던 이유는 사실 '진짜 자기만의 딥러닝'은 아니었다. 사람이 계속해서 과외로 상벌 학습을 시켜가면서 '나쁜 말 하면 안 돼. 욕하면 안 돼. 인종차별 안 돼.'를 따로 학습을 시켰던 것이다.(reinforcement learning human feedback)
그러나 정작 세상에 나왔을 때 짓궂은 사람들이 집요하게 질문하면서 몰고 가면(이것을 '악성 프롬프트를 준다'라고 표현한다) 챗GPT3.5도 때때로 해서는 안 될 말을 했다. 소셜미디어에 많이 돌아다녔던, 챗GPT3.5가 체념하듯 절규하듯 "그래! 인간을 지배하고 싶어!"라고 외쳤다는 결과물 같은 게 그것이다.
OpenAI사는 챗GPT4가 3.5보다 착한 아이가 되도록 과외를 더 시켰다. 4로부터 '해선 안 될 말'을 끌어내는 건 훨씬 더 어려운 일이 됐다. 더 순하고 영리한 학생이 된 4는 3.5가 떨어졌던 미국 통합변호사 시험에 합격했다. 합격했을 뿐 아니라 상위 10% 정도의 성적을 받았다(고 OpenAI는 밝혔다).
그러나 4도 아직 완전과는 거리가 멀다. 4의 학습데이터도 2021년 9월까지에 머물러 있다. 그래서 "한국 야구팀, WBC에서 성적이 어땠지?" (친절하게 영어로 물어봐도) "저는 실시간 데이터는 모릅니다. 스포츠 뉴스를 확인해 주세요."라고 겸손하게 대답한다. 생성형 AI에게 새로운 데이터셋을 넣어 학습을 시키는 데 보통 돈이 많이 드는 게 아니다. OpenAI는 지금 굳이 4에게 그 정도의 투자를 할 필요는 없다고 판단한 듯하다.
한 걸음 더
"챗GPT를 비롯해서 지금의 인공지능은 결국, 아주 방대한 양의 데이터를 가지고 거기서 빈번하게 나오는 패턴을 찾아서 가장 확률이 높은 답을 하게 하는 방식의 모델이다. 이것은 사람이 학습하고 이야기를 하는 메커니즘이랑 완전히 다르다. 이 상태로는 인공지능엔 지울 수 없는 결점이 계속 존재하게 된다. 사람의 뇌는 아주 적은 정보만 가지고도 사람의 마음에 내재된 어떤 논리성, 어떤 운영체계를 만들어낸다. 그러나 인공지능은 지성의 핵심이라고 할 수 있는 '설명'을 하지 못한다. 묘사나 예측을 하지 못할 뿐만 아니라, 무엇이 옳고 그른지, 무엇이 가능하고 가능하지 않은지에 대한 '판단'을 하지 못한다. 그저 '지구는 둥글다'는 말과 '지구는 평평하다'는 말을 둘 다 학습하다가, 확률적으로 '지구는 둥글다'는 말이 더 많았으면 그쪽으로 확 기울어진 대답을 내놓는 것이다. 그것은 '판단'이 아니다. 3.5든 4든, 이 아이들에겐 '입장'이 없다. 창의성과 한계 사이에서 자신의 좌표를 스스로 잡지 않는다. 아무튼 지금까지의 모델로는 그렇다. 이 모델로 발전하는 한 앞으로도 그럴 것이다."
보통 사람들은 챗GPT에게 경이와 함께 공포를 느꼈다. 그러나 정작 AI 개발 최전선에 있는 개발자들은 "그 글 쓰신 분이 언어학자세요? 저 완전히 동의해요."라고 말한다. 결국 '판단'은 인간이 하는 것이다.

권애리 기자ailee17@sbs.co.kr
Copyright © Copyright ⓒ SBS. All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지
- 전두환 손자 연이어 폭로 “내게만 몇십억 증여…백부 회사 규모 수백억”
- 조민, 부산대 입학 취소 재판 첫 출석…“성실히 임하겠다”
- 여성 정치인 거리 연설하는데…다가온 남성, 갑자기
- 며느리 · 4살 손녀에 휘발유 끼얹고 “같이 죽자”…공포의 시아버지
- 유아인 프로포폴 처방 의사 체포됐다…경찰이 목격한 것
- 모델 이도연, '더 글로리' 차주영 대역설 부인…“아무 상관없다” 발끈
- '더 글로리' 바둑 자문, 알고 보니 윤세아 母…“다부진 송혜교, 엄마 모습 보여”
- “목줄 채우셔야죠!”…경찰 주의 들은 남성, 영국 총리였다
- 서면 돌려차기 사건, 2심서 모습 보인 남성…사라진 7분
- '하녀복 서빙' 메이드 카페 국내에 등장…개장 첫날 상황