엉뚱한 옛 정보 답하는 AI…KAIST, 시간 오류 잡는 평가기술 개발

전동흔 2026. 4. 14. 10:35
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

최신 정보를 제대로 반영하지 못하는 거대언어모델(LLM)의 시간 오류를 잡아내는 평가 기술을 국내 연구진이 개발했습니다.

KAIST는 전기및전자공학부 황의종 교수 연구팀이 마이크로소프트연구소와 시간 데이터베이스 기술을 활용해 LLM의 시간 추론 능력을 자동으로 평가·진단하는 시스템을 개발했다고 오늘(14일) 밝혔습니다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

최신 정보를 제대로 반영하지 못하는 거대언어모델(LLM)의 시간 오류를 잡아내는 평가 기술을 국내 연구진이 개발했습니다.

KAIST는 전기및전자공학부 황의종 교수 연구팀이 마이크로소프트연구소와 시간 데이터베이스 기술을 활용해 LLM의 시간 추론 능력을 자동으로 평가·진단하는 시스템을 개발했다고 오늘(14일) 밝혔습니다.

기존에는 LLM이 지난달 취임한 장관이 누구냐는 질문에 이전 장관 이름을 답하는 등 최신 정보를 반영하지 못하는 문제가 있었습니다.

이를 해결하기 위해 연구팀은 시간 데이터베이스 설계 이론을 토대로 날짜와 기간이 얽힌 복잡한 문제를 사람이 직접 만들지 않아도 자동으로 생성하도록 했습니다.

시간 데이터베이스는 현재 상태만 저장하는 일반 데이터베이스와 달리, 특정 시점의 데이터를 추적·조회할 수 있어 시간에 따라 변하는 정보를 반영한 데이터베이스입니다.

정보가 변경됐을 때 데이터베이스만 업데이트하면 문제와 정답, 검증 기준도 함께 자동으로 바뀝니다.

또, 답만 맞는지 보는 데 그치지 않고 답변에 들어간 날짜와 기간의 흐름이 논리적으로 맞는지도 함께 따집니다.

이 방식으로 겉보기엔 맞아 보여도 시간상 근거가 틀린 '시간 환각'을 기존보다 평균 21.7% 더 정확하게 찾아냈다고 KAIST는 설명했습니다.

연구팀은 평가에 필요한 입력 데이터도 평균 51% 줄어들어 유지 비용도 낮출 수 있다고 밝혔습니다.

이번 연구 결과는 이번달 열리는 인공지능 분야 국제학술대회 'ICLR 2026'에서 발표될 예정입니다.

[사진 출처 : 연합뉴스 / KAIST 제공]

■ 제보하기
▷ 전화 : 02-781-1234, 4444
▷ 이메일 : kbs1234@kbs.co.kr
▷ 카카오톡 : 'KBS제보' 검색, 채널 추가
▷ 유튜브, 네이버에서도 KBS뉴스를 구독해주세요!

전동흔 기자 (east@kbs.co.kr)

Copyright © KBS. All rights reserved. 무단 전재, 재배포 및 이용(AI 학습 포함) 금지