두나무 텍스트-SQL 변환 모델, BIRD-SQL 글로벌 리더보드 1위

박수현 기자 2024. 1. 25. 09:14
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

두나무가 자사 머신러닝팀이 연구·개발한 텍스트-SQL 변환 모델이 글로벌 인공지능(AI) 모델 평가 지표인 BIRD-SQL에서 글로벌 리더보드에서 1위를 달성했다고 25일 밝혔다.

텍스트-SQL 변환 모델은 사람의 언어를 데이터 관리 프로그래밍 언어인 SQL로 변환하는 AI 모델로 생성형 AI의 등장 이후 큰 관심을 받는 연구 분야다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

두나무 CI. /사진제공=두나무

두나무가 자사 머신러닝팀이 연구·개발한 텍스트-SQL 변환 모델이 글로벌 인공지능(AI) 모델 평가 지표인 BIRD-SQL에서 글로벌 리더보드에서 1위를 달성했다고 25일 밝혔다.

텍스트-SQL 변환 모델은 사람의 언어를 데이터 관리 프로그래밍 언어인 SQL로 변환하는 AI 모델로 생성형 AI의 등장 이후 큰 관심을 받는 연구 분야다.

이번에 두나무 머신러닝팀이 개발한 텍스트-SQL 모델은 사용자가 자연어로 질문을 입력하면 SQL 변환이 필요한 데이터를 빠르고 정확하게 추출해 챗 GPT의 성능을 한층 강화하는 것이 특징이다.

두나무 머신러닝팀이 연구·개발한 텍스트-SQL 변환 모델이 AI 모델 성능 측정 벤치마크인 BIRD-SQL의 글로벌 리더보드에서 정확도 점수 65.4%, 효율성 점수 71.3%를 받았다. /사진제공=두나무

이 모델은 AI 모델 성능 측정 벤치마크인 BIRD-SQL(A Big Bench for Large-Scale Database Grounded Text-to-SQLs)의 글로벌 리더보드에서 정확도 점수 65.4%, 효율성 점수 71.3%를 각각 받으며 모두 1위에 올랐다.

이는 GPT-4의 정확도(54.8%)와 효율성(60.7%)을 각각 10% 이상 상회하는 수치다. 2위 모델과도 정확도 항목에서 4.7%, 효율성에서 3.6%의 높은 성능 격차를 기록했다. 처음 1위에 오른 지난 14일 이후 현재까지도 계속 선두를 지키고 있다.

두나무는 이번 연구를 통해 증권플러스에서 제공하는 인공지능 대화형 서비스 '우디'의 자연어를 통한 종목 스크리닝 성능을 크게 향상시킬 수 있을 것으로 기대하고 있다.

이동준 두나무 머신러닝팀장은 "챗 GPT로 촉발된 생성형 AI 기술 개발이 활발해지면서 두나무는 보다 정교하게 자연어를 이해하고 누구나 쉽게 기술을 활용할 수 있도록 연구하고 있다"며 "명령어에 따라 성능이 크게 달라지는 거대언어모델(LLM)의 한계점을 개선하는 데 초점을 맞춰 두나무의 다양한 서비스 향상에 기여하도록 노력하겠다"고 말했다.

박수현 기자 literature1028@mt.co.kr

Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?