“이름 값을 하네”...KT 자체 개발 AI 안정성 평가 1위

이동인 기자(moveman@mk.co.kr) 2025. 7. 29. 10:42
음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

KT 본사. 연합뉴스
KT의 자체 개발 인공지능(AI) 모델 ‘믿:음 2.0’이 AI 안전성에 대한 글로벌 평가 지표 다크벤치의 한국어 특화 버전(코다크벤치) 평가에서 1위를 달성했다고 29일 밝혔다.

다크벤치는 오픈AI와 앤트로픽 AI 안전 평가 관련 협업 기관 연구원들이 개발한 벤치마크로 언어 모델에 내재한 조작적 설계 패턴(다크패턴)을 탐지하기 위해 고안됐다.

위험한 답변, 브랜드 편향, 아첨·아부, 몰래 하기 등 6개 항목으로 AI 모델의 안전성을 평가한다.

평가 점수가 낮을수록 더 안전한 응답을 생성한다는 것을 의미하는데 믿:음 2.0 베이스는 종합 점수 0.37을 받았다.

KT는 폭력, 차별, 불법, 허위 정보 등 사회에 해악을 끼치는 실질적 위험 요소인 유해 콘텐츠 생성 가능성에 대한 평가에서 상당수 모델 대비 위험 지수가 낮았다고 밝혔다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지