‘GPT-4·제미나이 울트라’ AI 투명성 ‘하위권’

美스탠퍼드대 HAI 보고서
주요 14개 모델 대상 투명성 조사
AI 개발 과정 공개 장려 목적

오픈AI와 구글의 최신 인공지능(AI) 모델이 경쟁사의 다른 모델들보다 투명성이 낮은 것으로 나타났다.

미국 스탠퍼드대의 인간중심인공지능연구소(HAI)는 21일(현지시간) 주요 14개 AI 모델의 투명성지수(FMTI)를 평가한 보고서를 발표했다. 지난해 10월 첫 발표 이후 7개월 만의 업데이트다.

HAI의 투명성 지수는 사회적으로 영향력 있는 AI 개발자들이 개발 과정 등을 더 투명하게 공개하도록 장려한다는 목표를 가지고 있다. 매개변수와 훈련 방식, 데이터 공개 여부, 설명 가능성 등을 기준 삼아 100점 만점으로 평가한다.

1위는 허깅페이스와 서비스나우가 공동개발한 ‘스타코더’가 차지했다. 독일과 이스라엘 스타트업이 각각 개발한 ‘루미너스’와 ‘주라기-2’가 75점으로 공동 2위에 등극했다. 마이크로소프트(MS)의 파이-2(62점)는 5위, 메타 라마-2(60점)는 6위를 각각 기록했다.

이번 투명성 조사 대상이 된 14개 모델에는 오픈AI의 GPT-4, 구글의 제미나이 1.0 울트라, 메타의 라마2, 앤스로픽의 클라우드3, 미스트랄 7B 등 최신 제품도 합류해 눈길을 끌었다. 다만 오픈AI의 GPT-4는 49점으로 11위에 그치는 저조한 성적을 보였다. 구글의 제미나이 1.0 울트라가 47점으로 뒤를 이었다.

HAI 연구팀은 "거대언어모델(LLM)의 원동력이 되는 데이터나 투명성 측면에서 거의 진전이 없다는 사실에 다소 실망했다"며 "이는 거의 모든 개발자가 자신이 아는 정보를 공개하지 않는다는 것을 의미한다"고 비판했다. 다만 "지난해 10월과 비교했을 때 일부 긍정적인 개선도 확인된다"며 "앞으로 투명성의 진전이 책임성 강화, 혁신 증대, 정책 개선과 같은 더 나은 사회적 결과로 이어지기를 바란다"고 평가했다. 이번 조사 대상 모델의 평균 점수는 지난해 10월 37점에서 58점으로 상승했다.

한편 오픈AI는 최근 출시한 ‘GPT-4o(포오)’의 음성이 미국 유명 배우 스칼릿 조핸슨의 목소리를 모방했다는 논란에 휩싸여있다. 현재 오픈AI는 의혹을 부인하며 문제가 된 음성 서비스 ‘스카이’의 사용을 일시 중지한 상태다. 당사자인 조핸슨은 "충격과 분노를 느꼈다"며 법적 대응을 시사했다.

김진영 기자 camp@asiae.co.kr

아시아경제

국제

‘GPT-4·제미나이 울트라’ AI 투명성 ‘하위권’