"AI 생산성 성능 제대로 평가"

김대기 기자(daekey1@mk.co.kr) 2025. 9. 25. 17:33
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

삼성전자가 자체 개발한 인공지능(AI) 업무 생산성 벤치마크 '트루벤치'를 출시했다고 25일 밝혔다.

트루벤치는 삼성전자 DX부문 선행 연구개발조직인 삼성리서치가 사내 생성형 AI 모델 적용 경험을 바탕으로 개발한 벤치마크로 AI 모델의 업무 생산성 성능을 평가한다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

삼성전자 '트루벤치' 선봬
실제 기업환경 반영해 적용

삼성전자가 자체 개발한 인공지능(AI) 업무 생산성 벤치마크 '트루벤치'를 출시했다고 25일 밝혔다. 트루벤치는 삼성전자 DX부문 선행 연구개발조직인 삼성리서치가 사내 생성형 AI 모델 적용 경험을 바탕으로 개발한 벤치마크로 AI 모델의 업무 생산성 성능을 평가한다.

이번에 삼성전자가 공개한 트루벤치는 기존 벤치마크와 차별화해 업무 생산성에 대한 집중 평가를 진행한다. 실제 평가는 10개 카테고리, 46개 업무, 2485개의 세분화된 항목으로 구성돼 있다.

평가 항목은 기업에서 자주 사용하는 콘텐츠 생성, 데이터 분석, 문서 요약 및 번역, 연속 대화 등 실제 오피스 업무에서 활용되는 체크 리스트를 기반으로 완성됐다.

사용자는 한 번에 최대 5개 모델을 선택해 비교할 수 있어 다양한 AI 모델 성능을 한눈에 파악 가능하다. 영어·한국어·일본어·중국어·스페인어 등 총 12개 언어를 지원한다. 특히 글로벌 비즈니스 환경을 고려해 영어와 한국어 등 여러 언어가 혼합된 교차 언어의 번역 기능 평가도 가능하다.

전경훈 DX부문 최고기술책임자(CTO) 겸 삼성리서치장(사장)은 "삼성리서치는 다양한 실제 적용 사례를 바탕으로 차별화된 생산성 AI 기술 경쟁력과 노하우를 보유하고 있다"며 "트루벤치로 생산성 성능 평가 기준을 정립하고 삼성전자의 기술 리더십을 더욱 공고히 할 것"이라고 말했다.

[김대기 기자]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지