구글·오픈AI도 제쳤다...생성AI 링크, 임베딩모델 벤치마크 1위

김태현 기자 2024. 6. 5. 22:30
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

미국 생성형 인공지능(AI) 전문 스타트업 링크(Linq)는 거대 임베딩 모델(Embedding Model) '링크' 가 허깅페이스의 '대량 텍스트 임베딩 벤치마크 리더보드(MTEB)' 텍스트 검색 평가에서 엔비디아·세일즈포스·구글·오픈AI 등을 제치고 세계 1위를 차지했다고 5일 밝혔다.

최찬열 링크 대표는 "기업이 생성형 AI 를 안전하게 도입하는데 있어 회사 내부 데이터 검색 정확도가 가장 중요하다"며 "금융이나 법률과 같이 텍스트 검색의 정확도가 매우 중요한 분야에서 검색 정확도를 보장해주는 엔진인 임베딩 모델을 전문 분야를 중심으로 고도화하겠다"고 말했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]

/사진제공=링크

미국 생성형 인공지능(AI) 전문 스타트업 링크(Linq)는 거대 임베딩 모델(Embedding Model) '링크' 가 허깅페이스의 '대량 텍스트 임베딩 벤치마크 리더보드(MTEB)' 텍스트 검색 평가에서 엔비디아·세일즈포스·구글·오픈AI 등을 제치고 세계 1위를 차지했다고 5일 밝혔다.

매사추세츠공대(MIT) 전기컴퓨터 공학과 박사 출신 최찬열 대표가 2022년 미국에서 설립한 이 업체는 법률, 보험, 금융, 헬스케어와 같은 전문 분야에 생성형 AI 솔루션을 제공하고 있다.

MTEB는 생성형 AI 검색 모델의 핵심인 임베딩 모델의 성능을 △분류(Classification) △클러스터링(Clustering) △쌍분류(PairClassification) △재순위(Reranking) △검색(Retrieval) △텍스트 의미적 유사도 (STS, Semantic Textual Similarity) △요약(Summarization) 등 7개 분야 평가데이터를 기반으로 순위를 정한다. 링크의 임베딩 모델은 텍스트 검색 분야에서 최초로 60점을 넘어 1위를 차지했다. 임베딩 모델은 거대언어모델(LLM)의 환각 문제을 해결하는 핵심 모델을 뜻한다.

이번 MTEB 프로젝트를 리드한 김준성 박사는 "우리는 사람이 라벨링한 데이터와 비슷한 품질의 데이터를 LLM을 통해서 효율적으로 만들었다" 며 "효율적인 검색증강생성(RAG)을 위한 임베딩 모델을 빠르고 비용 효율적으로 만드는 방법을 고안하게 돼 기쁘다"고 강조했다.

최찬열 링크 대표는 "기업이 생성형 AI 를 안전하게 도입하는데 있어 회사 내부 데이터 검색 정확도가 가장 중요하다"며 "금융이나 법률과 같이 텍스트 검색의 정확도가 매우 중요한 분야에서 검색 정확도를 보장해주는 엔진인 임베딩 모델을 전문 분야를 중심으로 고도화하겠다"고 말했다.

2022년 창업한 링크는 MIT 전기컴퓨터공학과를 졸업한 최 대표와 MIT 계산과학공학과 방수빈 박사 등이 모여 창업한 회사다. 같은해 카카오벤처스, 스마일게이트인베스트먼트, 옐로우독 등으로부터 초기투자를 받았다.

[머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리']

김태현 기자 thkim124@mt.co.kr

Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?