"환각 줄인 생성AI, 누가 잘하나" 올거나이즈, 성능평가순위 공개
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
RAG는 생성형AI의 환각(할루시네이션)현상을 최소화할 수 있는 검색 기술이다.
사전에 학습되지 않은 데이터에서도 답을 찾아내고 답변 중 질문 및 검색어의 맥락을 고려해 적절한 대답을 제공한다.
이에 RAG가 답변을 생성하면 5개의 평가툴 중 3개 이상에서 오류가 없을 경우 '이상 없음'으로 판명한다.
알리 RAG리더보드의 측정 항목은 그림·표 등을 추출하는 능력, 원하는 대답을 즉시 찾는 능력, 답변생성 능력 등 RAG의 3가지 핵심요소가 모두 포함된다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]
업무용 AI 도입을 지원하는 올거나이즈가 RAG(검색증강생성) 리더보드인 '알리 RAG 리더보드'를 공개한다고 29일 밝혔다.
RAG는 생성형AI의 환각(할루시네이션)현상을 최소화할 수 있는 검색 기술이다. 사전에 학습되지 않은 데이터에서도 답을 찾아내고 답변 중 질문 및 검색어의 맥락을 고려해 적절한 대답을 제공한다. 올거나이즈의 RAG 리더보드는 RAG 기술의 성능을 측정해 순위를 매겨 기업 AI 실무자들이 가장 적절한 솔루션을 비교 도입할 수 있도록 돕는다.
알리 RAG 리더보드는 금융, 공공, 의료, 법률, 커머스의 5개 분야로 구성돼 있다. RAG 기술을 등록하면 리더보드는 이를 활용해 각 분야별로 2~300페이지의 문서를 업로드한 후, 분야마다 60가지의 질문을 던진다. 이에 RAG가 답변을 생성하면 5개의 평가툴 중 3개 이상에서 오류가 없을 경우 '이상 없음'으로 판명한다. 해외 RAG 리더보드의 경우 일반적으로 1~2개의 평가 툴만을 활용한다.
알리 RAG리더보드의 측정 항목은 그림·표 등을 추출하는 능력, 원하는 대답을 즉시 찾는 능력, 답변생성 능력 등 RAG의 3가지 핵심요소가 모두 포함된다.
이창수 올거나이즈 대표는 "AI 생태계에 기여하기 위해 테스트 데이터셋을 모두 공개했으며 이를 활용해 한국어로 된 다양한 RAG 솔루션의 성능이 향상됐으면 하는 바람이 있다"며 "대학 및 개인 연구자들은 AI 연구에 도움을 받을 수 있을 것이고 기업들 역시 성능 좋은 RAG를 도입해 업무 생산성 증대를 경험할 수 있을 것"이라고 밝혔다.
[머니투데이 스타트업 미디어 플랫폼 유니콘팩토리]
고석용 기자 gohsyng@mt.co.kr
Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지
- 강형욱 아내 미담 등장…"수억원 불탔다" 물류업체 대표에 보인 반응 - 머니투데이
- 김호중 술자리 래퍼는 길 "끼리끼리" 반응 왜?…과거 음주운전 3번 - 머니투데이
- 남편 일 관두고 14년째 전업주부…의사 아내 "난 복 많은 여자" - 머니투데이
- 이상민, 전처 이혜영 노래 나오자 정색…"그만 불러" 탁재훈 당황 - 머니투데이
- 돌잔치 축하금 냈는데…"돌잡이용 '현금' 또 걷더라" 당황 - 머니투데이
- '돌돌싱' 61세 황신혜 "더 이상 결혼 안 할 것…연애엔 열려있어" - 머니투데이
- 채림 "이제 못 참겠는데"…전 남편 가오쯔치 관련 허위 글에 '분노' - 머니투데이
- 트럼프 전기차 보조금 폐지 가능성 보도…국내 이차전지주 '급락' - 머니투데이
- "트럼프 인수위, 전기차 보조금 폐지 계획"…머스크도 환영? - 머니투데이
- 한번 오면 수천만원씩 썼는데…"중국인 지갑 닫아" 면세점 치명타 - 머니투데이