AI 학습 단어에 '도박'·'성인물'…오픈AI, 비영어권 홀대 논란

황동진 2024. 5. 31. 18:41
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

오픈AI가 최신 인공지능(AI) 모델의 비영어 성능을 개선하는 데 부적절한 데이터를 사용했다는 분석이 제기됐다.

오픈AI가 영어가 아닌 언어의 안전 문제에 소홀하다는 우려의 목소리가 나온다.

31일 업계에 따르면 오픈AI의 최신 AI 모델 'GPT-4o'에 사용된 토크나이저 'o200k_base'의 한국어 토큰 목록에서 '출장안마' '출장샵' '안마방'과 같은 어휘가 발견됐다.

부적절한 단어는 AI 모델의 취약점이 될 수 있다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

최신모델 'GPT-4o'
성능 개선 과정서
언어 안전문제 제기
한국·중국어 토큰서
부적절한 단어 포착
AI 윤리·안전과 직결

오픈AI가 최신 인공지능(AI) 모델의 비영어 성능을 개선하는 데 부적절한 데이터를 사용했다는 분석이 제기됐다. 오픈AI가 영어가 아닌 언어의 안전 문제에 소홀하다는 우려의 목소리가 나온다.

31일 업계에 따르면 오픈AI의 최신 AI 모델 ‘GPT-4o’에 사용된 토크나이저 ‘o200k_base’의 한국어 토큰 목록에서 ‘출장안마’ ‘출장샵’ ‘안마방’과 같은 어휘가 발견됐다. 중국어 토큰 목록에서도 같은 문제가 있었다. 지난 17일 기술 전문 매체 MIT테크놀로지리뷰는 같은 토크나이저의 중국어 토큰 목록에 ‘최신고화질미검열(最新高无)’ ‘성인영화(av影)’와 같은 성인물, 도박 관련 키워드가 포함됐다고 보도했다.

토크나이저는 텍스트를 AI 모델이 처리할 수 있는 단위인 ‘토큰’으로 나눠주는 프로그램이다. AI 모델이 텍스트를 처리하는 데 핵심적인 역할을 한다. “나는 밥을 먹었다”를 ‘나는’ ‘밥을’ ‘먹었다’의 토큰 단위로 나누고 각각의 토큰에 컴퓨터가 처리 가능한 숫자를 부여하는 식으로 텍스트를 처리한다.

토큰 목록에는 토크나이저 구축을 위한 훈련 데이터에 자주 등장한 단어들이 등록된다. 특정 언어 토큰 목록에서 부적절한 단어가 발견된 것은 토크나이저의 해당 언어 훈련 데이터에 부적절한 내용이 유의미한 비율로 포함됐다는 의미다. 부적절한 단어는 AI 모델의 취약점이 될 수 있다. 사용자가 이를 악용해 모델에 부적절한 답변을 유도할 수 있다는 설명이다.

오픈AI는 최근 AI 윤리·안전 문제로 곤란을 겪고 있다. 지난 21일에는 배우 스칼릿 조핸슨의 목소리를 무단으로 도용했다는 의혹으로 GPT-4o의 기본 목소리 중 하나를 삭제했다.

황동진 기자 radhwang@hankyung.com

Copyright © 한국경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?