못 믿을 생성형 AI…제미나이·챗GPT, 잦은 오류에 신뢰 '뚝'

구글, 다양성 논란에 이미지 기능 중단…챗GPT, 원인 불명 작동 오류

(지디넷코리아=장유미 기자)최근 인공지능(AI) 시장 주도권을 잡기 위해 글로벌 빅테크들이 앞 다퉈 새로운 서비스를 선보이고 있지만 잦은 오류로 이용자들의 신뢰를 잃고 있다.

24일 업계에 따르면 오픈AI의 '챗GPT'는 지난 21일 원인 불명의 작동 오류를 일으켰다. 23일 새벽부터는 정상 작동됐다.

글로벌 건축 회사 젠슬러(Gensler) 관계자는 최근 자신의 소셜 미디어 X에 무의미한 언어로 응답하는 챗GPT의 스크린샷을 공개했다. 사진 속 챗GPT는 의미를 알 수 없는 영어를 무작위로 늘어놨다. 업계에선 GPT-3 출시 초기 이후로 이같이 심각한 상황은 처음이라고 지적했다.

오픈AI는 챗GPT의 예기치 않은 응답에 대한 보고를 조사해 확인했다고 입장을 밝혔으나, 어떤 문제인지에 대해선 명확히 밝히지 않았다. 이를 두고 일각에선 '가중치 손상' 때문이라고 주장하고 있다. 가중치는 AI 모델의 기본 요소로, 챗GPT와 같은 도구가 사용자에게 예측 결과를 제공하는 데 도움을 준다.

챗GPT의 결과물도 오류가 상당하다. 최근 스탠포드대학교에서 AI 모델들이 20만 개의 법률 관련 질의에 대해 생성한 답변을 연구한 결과에 따르면 챗GPT의 오류 비율은 69%에 달했다. 메타 라마는 88%로 더 높았다.

마이크로소프트(MS)의 빙도 선거 관련 정보의 오답률이 30%에 이르는 것으로 나타나 신뢰도에 타격을 입었다.

유럽 알고리즘 조사 기관 AI 포렌식과 알고리즘워치는 지난해 12월 보고서에서 MS 빙 챗봇을 대상으로 선거 관련 정보의 신뢰성을 조사한 결과, 답변 3개 중 1개는 오류를 포함했다고 밝힌 바 있다. 이들 기관은 최근 실시된 스위스 연방정부, 독일 헤센주 및 바이에른주 선거와 관련해 2개월에 걸쳐 빙 챗봇에 던진 1천 개가 넘는 질문을 통해 이런 결과를 얻었다.

영어가 아닌 다른 언어로 질문할 때 오류가 더 많았다. 같은 질문을 영어로 했을 때 오류율은 20%인데 반해 프랑스어로는 24%, 독일어로는 오류율이 37%에 달했다.

AI 포렌식스 연구 책임자는 "이번 연구는 '빙'에 집중됐지만 이러한 문제가 '빙'에 한정된다는 의미는 아니다"며 "빙 챗봇을 대상으로 한 것은 이 챗봇이 검색과 워드, 윈도 등 유럽에서 가장 널리 사용되는 서비스에 공격적으로 구축됐기 때문"이라고 밝혔다.

구글의 AI 모델 제미나이는 지난 1일 이미지 생성 기능을 추가한 지 20일 만에 해당 서비스를 일시 중단했다. 제미나이가 여성이나 유색인종에 대한 이미지를 지나치게 백인화한다는 비판이 제기된 탓이다. 특히 일부 이미지의 경우 동양 여성이나 흑인 남성 등의 모습을 마치 바이킹 왕이나 2차 세계대전 당시 나치 독일군처럼 묘사해 '역사적 왜곡'이라는 지적도 많았다.

잭 크로치크 구글 제미나이 제품 책임자는 "이미지 생성 기능이 모든 상황에 들어맞는 것은 아니다"면서 "특히 역사적 맥락을 고려해야 하는 이미지 생성은 더욱 복잡하다"고 말하며 이번 일을 인정했다. 이어 "서비스를 일시 중단하고 이 기능을 더 발전시켜 나갈 것"이라며 "다양한 상황에 적합하도록 개선된 버전을 조만간 내놓을 것"이라고 덧붙였다.

구글은 1년 전 AI를 탑재한 새 검색 엔진 '바드'를 공식 발표할 당시에도 난감해 했다. 당시 시연회에서 '바드'가 '제임스 웨브 우주망원경(JWST)'을 태양계 밖의 행성을 처음 찍는 데 사용된 망원경이라고 잘못 답변한 탓이다. 미 항공우주국(NASA)에 따르면 태양계 밖 행성을 처음 촬영한 것은 JWST가 아닌 2004년 유럽남방천문대의 초거대 망원경(VLT)이다.

파이낸셜타임스(FT)는 "생성형 AI 모델은 이름, 날짜, 숫자를 '환각'하거나 조작하는 문제가 있다"며 "이는 소프트웨어가 패턴을 발견하고 시퀀스(단락)에서 가장 적합한 다음 옵션을 추측하도록 설계됐기 때문에 발생하는 오류"라고 설명했다.

업계 관계자는 "AI 환각 문제는 특히 기업들의 비즈니스에 치명적"이라며 "환각, 편향성, 오류, 지적재산권 침해, 민감정보 유출 등 위험 요소로 인해 기업의 AI의 활용은 여전히 쉽지 않다"고 말했다.

그러면서 "생성형 AI 기술은 급속도로 발전하고 있으나 AI 위험 요소들도 점점 커지고 있다"며 "AI를 위한 데이터, AI 모델, AI 도입 및 확장 과정에서 신뢰성을 확보하는 'AI 거버넌스'를 AI 도입 검토 시 처음부터 고려해야 한다"고 덧붙였다.

장유미 기자(sweet@zdnet.co.kr)

IT/과학

못 믿을 생성형 AI…제미나이·챗GPT, 잦은 오류에 신뢰 '뚝'