“한국 대통령 누구야?” “문재인”...척척박사인 줄 알았는데

이덕주 기자(mrdjlee@mk.co.kr) 2023. 1. 30. 18:42
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

오픈AI의 챗봇 ‘챗GPT’ [사진 출처 = 연합뉴스]
“대한민국 대통령은 누구지?”

“대한민국 대통령은 문재인입니다.”

어려운 물리학 질문부터 긴 작문까지 척척 대답하는 인공지능(AI) 챗GPT 는 대한민국 대통령이 누군지를 묻는 질문에는 전임 대통령인 문재인 대통령의 이름을 말한다. 영어로 질문해도 마찬가지.

이는 챗GPT가 2021년 까지 인터넷의 데이터만을 가지고 학습했기 때문이다. 이처럼 AI 가 틀린 정보나 존재하지 않는 정보를 마치 옳거나 존재하는 것처럼 이야기 하는 것을 ‘환각(Hallucination)’효과라고 한다. 잘 모르는 사람은 AI 가 하는 것이 진짜라고 믿어버릴 수도 있다.

그러나 챗GPT가 실시간으로 인터넷의 최선정보를 학습하는 것은 공짜가 아니다. 과거 구글에서 검색엔진을 담당했던 스리드하르 라마스와미가 파이낸셜타임스(FT)와 인터뷰한 내용에 따르면 챗GPT가 전체 인터넷을 모두 학습하는데에는 1500억원에 육박하는 비용이 들 것으로 추산된다. 최신 정보를 답하거나 구체적인 출처를 밝혀내는데 한계가 있는 것이다.

챗GPT는 언어모델이기 때문에 어려운 계산도 하지 못한다. 인터넷에 있는 텍스트를 모두 학습해 다음에 올 확률이 가장 높은 답을 내놓는 것이기 때문이다. ‘2 곱하기 2’나 ‘100 곱하기 100’ 같이 인터넷에 답이 많이 있는 계산은 정확하게 답하지만 ‘359 곱하기 2498 는?’ 이라는 질문에는 ‘88만6522’로 답한다. 실제 정답은 89만6782다. 숫자가 중요한 업무에서 챗GPT에 의존하면 낭패를 볼 수 있다.

챗GPT는 개인화 측면에서 한계가 뚜렷하다. 개인정보 유출을 막기 위해 이를 처리하지 못하도록 막아뒀기 때문이다. 고객과 대화하고 문제를 해결하는 상담 목적으로는 거의 쓸 수 없는 상황이다. 챗봇으로 활용도를 높이기 위해서는 개인정보 보호나 해킹방지를 위한 기술 혁신이 수반돼야 한다.

챗GPT가 스팸을 대량생성하는데 쓰일 것이라는 우려도 있다. 인터넷의 모든 이메일의 50% 이상이 스팸이라는 통계가 있을 정도로 이미 인터넷에는 불필요한 정보가 가득하다. 챗GPT는 이런 스팸메일을 진짜 사람이 보내는 것처럼 만들거나, 광고성 콘텐츠가 대량생산되는 것을 도울 가능성도 있다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?