“이름 값을 하네”...KT 자체 개발 AI 안정성 평가 1위
이동인 기자(moveman@mk.co.kr) 2025. 7. 29. 10:42

KT의 자체 개발 인공지능(AI) 모델 ‘믿:음 2.0’이 AI 안전성에 대한 글로벌 평가 지표 다크벤치의 한국어 특화 버전(코다크벤치) 평가에서 1위를 달성했다고 29일 밝혔다.
다크벤치는 오픈AI와 앤트로픽 AI 안전 평가 관련 협업 기관 연구원들이 개발한 벤치마크로 언어 모델에 내재한 조작적 설계 패턴(다크패턴)을 탐지하기 위해 고안됐다.
위험한 답변, 브랜드 편향, 아첨·아부, 몰래 하기 등 6개 항목으로 AI 모델의 안전성을 평가한다.
평가 점수가 낮을수록 더 안전한 응답을 생성한다는 것을 의미하는데 믿:음 2.0 베이스는 종합 점수 0.37을 받았다.

KT는 폭력, 차별, 불법, 허위 정보 등 사회에 해악을 끼치는 실질적 위험 요소인 유해 콘텐츠 생성 가능성에 대한 평가에서 상당수 모델 대비 위험 지수가 낮았다고 밝혔다.
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
매일경제에서 직접 확인하세요. 해당 언론사로 이동합니다.
- 주가 100만원 돌파 노린다…다음 ‘황제주’에 쏠린 눈 - 매일경제
- 신평 변호사 “尹 전 대통령, 쭈그리고 앉아 식사…처참한 주거환경” - 매일경제
- “대출 규제가 불 지폈나”…처음으로 40억원 넘긴 ‘이 아파트’ - 매일경제
- 30억 아파트 벽에 금이 ‘쩍’, 입주민은 ‘불안불안’…‘올파포’ 전수조사 착수 - 매일경제
- “신체적 학대 하지 않았다”…2살 원아 얼굴 부상, 어린이집 교사 CCTV 보니 - 매일경제
- “韓 나 만나러 스코틀랜드로 날아와”…美상무장관이 말하는 한국인의 정체 - 매일경제
- 트럼프, 아직 무역합의 안한 국가에 “관세 15∼20%일 것” - 매일경제
- [속보] 법인세 인상 속도…민주당·정부 “尹정부 낮췄던 법인세·대주주 기준 원상복구” - 매일
- “카드값 못 막는 사람 너무 많아”…상반기 카드사 실적 타격, 순익 18% 감소 - 매일경제
- ‘英 단독!’ 손흥민, 결국 LA FC로 향하나? ‘556억원’ 사우디 관심 속 영입 협상 진전…“계약