[Digital+] "어떤게 사람이 쓴 詩일까?"..절반이 AI 글 골랐다
자연어 처리 능력 대폭 향상
상상력·장문 작성은 부족
인간이 쓴 시와 AI가 쓴 시를 인간은 구분할 수 있냐는 질문에 대해 지난해 6월 1일 이전까지만 해도 사람이 구분해낼 수 있을 것이란 의견도 많았다. 하지만 일론 머스크 테슬라 최고경영자(CEO) 등이 속한 AI 연구기관 오픈AI가 강력한 언어모델인 'GPT-3'를 공개하고는 구분이 불가능하다는 쪽으로 의견이 수렴됐다.
GPT-3는 머신 러닝 기반의 자연어 처리 모델이다. 몇 개의 단어나 문장을 입력하면 그 뒤 문장에 나올 적절한 단어가 무엇일지 예측해 제시한다. 인터넷에서 긁어온 4990억개의 텍스트 데이터를 바탕으로, 1750억개의 매개 변수로 학습이 이뤄졌다. 오픈AI는 그동안 AI 결과물들을 무료로 공개해왔지만 마이크로소프트(MS)가 GPT-3의 독점 라이선스를 지난해 9월 획득해 사실상 유료화됐다.
그동안 AI 언어모델은 자연어 처리, 번역 등에 뛰어난 성능을 나타내온 구글의 AI 언어모델 '버트'가 시장을 주도해왔다. GPT-3 공개 이후 사람들에게 사람이 쓴 글과 GPT-3가 쓴 글을 함께 보여주고 어느 쪽이 사람이 쓴 것인지 물었을 때 정답률은 52%에 불과했다. 사실상 사람이 쓴 것과 거의 구분이 안 되는 수준에 이르렀다고 할 수 있다. 아직 GPT-3에 허점도 존재한다. 일반 상식이 아니라 사람의 상상력으로 만든 문장에 대한 대답이 부족하다. 이력서 등 짧은 글이 아닌 장문의 글에는 일관성이 없다는 평가도 나온다. 이준환 서울대 언론정보학과 교수는 "MS가 현존하는 최고 AI GPT-3에 미리 문장을 학습시켜 적합한 문장을 찾아내는 방식으로 문장을 생성하지만 아직은 한계가 분명하다"며 "자연어 처리 모델을 도구로 이용한다면 콘텐츠를 생산하는 인간 능력을 향상시킬 수도 있다"고 말했다.
[이동인 기자]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]
ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지