[챗GPT가 바꾸는 세상/1] 성능 발전 무서울 정도… 시간 아낄 도구지만 맥락·사실판단 한계

팽동현 2023. 1. 29. 18:56
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

고성능 모델 등장에 기대·전망 ↑
정보검색·문서작업 활용성 탁월
방대한 데이터에도 만능은 아냐
배재경 업스테이지 AI프로덕트 리더(전 카카오 검색엔진 리더)

최근 놀라운 성능의 '챗GPT(챗GPT) 모델' 등장으로 AI(인공지능)의 잠재성에 대한 기대와 전망에 대한 논의가 활발하다. 모델 학습과 추론이 이뤄지는 원리를 바탕으로 이후 전망과 대응 방안에 대해 의견을 정리해보고자 한다.

챗GPT는 언어 모델로, 먼저 언어 모델에 대해 알아볼 필요가 있다. 언어 모델은 주어진 텍스트에서 다음에 나올 글자나 단어를 예측하는 모델이다. "나는 밥을 ___" 이 문장에서 빈칸에 이어질 내용으로 "먹는다"를 예측할 수 있다. 이런 문장을 많이 모아 빈칸 채우기 방식으로 모델을 학습시키면 새 문장이 나왔을 때도 적합한 단어를 예측할 수 있다.

언어 모델은 학습 과정에서 맥락 정보가 매우 중요하다. "나는 밥을 __", "나는 아침에 밥을 __", "나는 어제 아침에 밥을 __" 이들은 뒤로 갈수록 맥락 정보가 많아지고, 빈칸에 들어갈 단어에 대한 예측 정확도가 높아진다. 이 때문에 모델은 점점 넓은 범위의 맥락을 볼 수 있도록 학습된다.

'빈칸 맞추기'라는 언어 모델의 목표는 단순하다고 여겨질수도 있지만, 점점 더 넓은 맥락과 복잡한 패턴을 이해해야 하기에 매우 강력한 도구로 쓰인다. 추가적인 장점은 세상의 모든 텍스트 정보를 학습에 활용할 수 있다는 점이다. 어찌보면 이 점 때문에 초거대 모델이 탄생했다고 볼 수도 있다.

언어 모델은 초창기에 검색어 자동완성에 활용하거나 음성인식에 활용해 인식 성능을 향상시키는 보조적인 목적으로 사용됐다. 스스로 완결된 결과를 만들어 내는 데는 한계가 있었기 때문이다. 그러다가 모델 구조가 고도화 되면서 한단어 뿐만 아니라 단어를 연속해서 예측해 나가는 방식으로 발전하면서 응용처가 더 많아졌다. 이 때문에 최근 나오는 언어 모델을 생성 모델이라 부르기도 한다.

신경망 기계번역 모델도 주어진 텍스트를 기반으로 다음에 나올 번역어를 하나씩 예측하는 대표적인 언어 모델 중 하나라고 볼수 있다.초기에 번역 이외에는 생성 모델이 큰 역할을 못하다가 학습에 사용되는 데이터를 극단적으로 늘리고 모델 크기도 키워봤더니 기대 이상의 성능을 보여줬다. 주어진 텍스트와 모델이 만들어내는 이후 문장들을 질문과 답변 형식으로 풀어낸 것이 GPT3 모델인데, 이미 3년전에 나와서 큰 주목을 끌었던 바가 있다.

이번에 나온 챗GPT는 여기에 추가적인 학습을 통해 자연어 질의 및 여러 패턴의 대화에서 맥락을 기억하면서 답을 잘 할 수 있도록 한 단계 더 최적화한 모델이다. 그렇다면 기존 모델 대비 챗GPT가 보여주는 두드러진 강점은 무엇일까?

첫째, 자연어 질의에 대하여 전문가 수준으로 정리된 답변을 잘 만들어 낸다는 점이다. 두번째는 대화를 통해 이전 대화의 맥락을 기억하고 이 기억을 토대로 추가적인 조건을 주면 기존 결과를 보완해 내는 능력이다.

마지막으로, 할 수 있는 일의 종류가 다양하다는 점이다. 챗GPT는 지식을 정리해서 알려주기도 하고 번역과 요약, 심지어 코드까지 작성해주고 이를 대화하면서 고칠 수 있게 도와주기도 한다. 정말 무섭게 느껴질 정도로 놀라울 정도의 성능과 발전 속도이다.

그렇다고 챗GPT는 만능이 아니다. 여전히 한계도 갖고 있다. 아무리 방대한 데이터로 학습되었다 해도 모델 학습 시 주어지는 텍스트가 모든 맥락 정보를 다 포함하고 있지는 않다. 이는 사람 사이의 대화와 비교해 보면 차이가 명확하다. 사람간의 대화에서는 눈에 보이지 않는 맥락 정보가 생각보다 훨씬 많은데, 눈빛, 몸짓 등 시각 및 청각을 포함한 다양한 정보의 원천으로부터 간접적으로 전달되는 맥락을 통해 대화가 이뤄진다. 이 때문에 숨은 의도, 농담 등도 잘 이해할 수 있다. 그리고 사람은 대화할 때 목적성을 가지는데 그 목적이 단순 사실의 전달뿐만 아니라 간곡한 요청, 농담, 공감에 대한 기대 등 매우 다양하다. 챗GPT는 "사람이 봤을 때 적합" 이라는 약간 뭉뚱거려진 목표로 최적화를 한 모델이어서 지식 전달 이외의 경우는 여전히 어색하거나 기계적인 대답이 많이 나오게 된다.

또 한가지 중요한 한계는 사실 여부에 대하여 명확하게 얘기해 주지 못한다는 점이다. 특히 시의성이 있는 정보, 예를 들어 최근 뉴스, 이벤트 등에 대해 엉뚱한 얘기를 하는데, 이는 어떻게든 사람이 봤을 때 말이 되는 형태의 결과를 최대한 만들어야 한다는 목표로 학습된 것이여서 발생하는 문제이다.

사람은 자신이 모르는 것에 대해 모른다고 판단하고 얘기할 수 있는데, AI모델이 이를 학습하려면 추가적인 장치가 필요하고 이에 대해선 아직 뚜렷한 해결책이 없다. 참고로, 모르는 것을 모른다고 하는 능력이 생긴다 해도 모델 학습에 걸리는 시간이 길기 때문에 지금 검색엔진 수준의 실시간성을 반영하기는 힘들 수도 있다.

결국 챗GPT 모델의 등장이 시사하는 바는 매우 똑똑한 새로운 도구가 하나 더 생긴 정도로 볼 수 있다. 영화 아이언맨의 '자비스'나 'Her'에 나오는 수준의 AI는 가까운 시일 내에는 달성되기 힘들것으로 예측된다. 모든 도구가 꼭 완벽해야할 필요는 없다. 도움이 되면 그걸로 충분하다. 예를 들어, 신경만 기계번역 모델이 나온 이후에 성능 한계에도 불구하고 많은 사람들이 필요한 상황에 잘 활용하고 있다.

챗GPT도 비슷하게 점점 우리 생활에 침투해 자연스럽게 활용될 것이고, 다음 두가지 분야에서 큰 역할을 할 것으로 보인다. 첫번째는 정보 검색 분야다. 머지않아 챗GPT를 활용하여 기존보다 편하게 자연어로 질의하고 검색 결과도 더 잘 정리된 형태로 답을 얻을 수 있을 것으로 예상된다. 하지만 시의성과 정확성이 더욱 요구되는 분야는 여전히 기존 검색엔진이 역할을 할 수밖에 없을 것이다.

두번째는 문서(프로그래밍 코드 포함) 작성 분야로, 더 극단적인 변화가 생길 것으로 전망된다. 이미 잘 알려져 있거나 관련 정보가 검색 가능하다면 해당 분야에서 정보를 다루는 분석자료, 보고서, 심지어 논문 등과 같은 문서도 이제부터는 모든 것을 직접 다 작성할 필요가 없다. AI 모델이 초벌 결과를 만들어 줄 수 있고, 모델과 대화하면서 개선해 나갈 수 있다.

이것이 의미하는 바는 사람은 새로운 아이디어, 더 고차원적인 추론에 더 집중하고 시간을 쏟을 수 있다는 말이다. 이러한 변화에 대해 완전히 새로운 대응 방안이 필요한 것은 아니다. AI와 별개로 이미 기술의 발전은 점점 도구를 효과적으로 활용하는 방식으로 사람들의 삶을 변화시켜 왔다. AI가 그것을 더 가속화하고 챗GPT의 등장으로 전문가뿐만 아니라 일반인도 편하게 도구를 활용하는 형태로 바뀌고 있을 뿐이다.

AI는 불쑥 우리 주변으로 다가왔다. 새로운 AI 기술에 대해 두려워하거나 막연한 기대를 할 일이 아니라 도구의 잠재성과 한계를 잘 이해하고 활용하는 것이 더 중요해지는 시점이다.

Copyright © 디지털타임스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?