두나무 텍스트-SQL 변환 모델, 글로벌 리더보드 1위

BIRD-SQL에서 글로벌 리더보드 1위 달성

(지디넷코리아=김한준 기자)두나무(대표 이석우)는 자사 머신러닝팀이 연구·개발한 텍스트-SQL 변환 모델이 글로벌 AI 모델 평가 지표인 BIRD-SQL에서 글로벌 리더보드 1위를 달성했다고 25일 밝혔다.

텍스트-SQL 변환 모델은 사람의 언어를 데이터 관리 프로그래밍 언어인 SQL로 변환하는 AI 모델로, 생성형 AI의 등장 이후 큰 관심을 받고 있는 연구 분야다.

두나무 머신러닝팀이 이번에 개발한 텍스트-SQL 모델은 사용자가 자연어로 질문을 입력하면 SQL 변환이 필요한 데이터를 빠르고 정확하게 추출, 챗GPT의 성능을 한층 강화시키는 것이 특징이다.

특히 AI 모델 성능 측정 벤치마크인 BIRD-SQL(A Big Bench for Large-Scale Database Grounded Text-to-SQLs)의 글로벌 리더보드에서 정확도 점수 65.4%, 효율성 점수 71.3%를 각각 받으며 모두 1위에 올랐다. 이는 GPT-4의 정확도(54.8%)와 효율성(60.7%)을 각각 10% 이상 상회하는 수치다. 2위 모델과도 정확도 항목에서 4.7%, 효율성에서 3.6%의 높은 성능 격차를 기록했다. 처음 1위에 오른 1월 14일 이후 현재까지도 계속 선두를 지키고 있다.

이번 연구를 통해 증권플러스에서 제공하는 인공지능 대화형 서비스 ‘우디’의 자연어를 통한 종목 스크리닝 성능을 크게 향상시킬 수 있을 것으로 기대된다.

이동준 두나무 머신러닝팀장은 “챗GPT로 촉발된 생성형 AI 기술 개발이 활발해지면서 두나무는 보다 정교하게 자연어를 이해하고 누구나 쉽게 기술을 활용할 수 있도록 연구하고 있다”며 “명령어에 따라 성능이 크게 달라지는 거대언어모델(LLM)의 한계점을 개선하는데 초점을 맞춰 두나무의 다양한 서비스 향상에 기여하도록 노력하겠다”고 말했다.

김한준 기자(khj1981@zdnet.co.kr)

IT/과학

두나무 텍스트-SQL 변환 모델, 글로벌 리더보드 1위