개발비 12분의 1로 줄였다...영어 기반 한국형 LLM 만든 비결
사전 학습부터 독자 개발한 한국형 모델 ‘1위’
2년 차 스타트업 트릴리온랩스는 설립 1년도 안 돼 인공지능(AI) 파운데이션 모델을 개발했다. 거대 AI 기업도 파운데이션 모델 개발에 막대한 시간과 비용을 투입하지만, 트릴리온랩스는 단기간에 학습 비용을 12분의 1로 줄였다. 최근 내놓은 차세대 대규모언어모델(LLM) ‘트리(Tri)-21B’는 AI 전문 기업 디노티시아가 평가한 LLM 한국어 랭킹에서 전체 4위, 사전 학습부터 독자 개발한 모델 중 1위에 오르며 성능을 인정받았다. 놀라운 건 단 16명이 만들어낸 성과라는 점이다.
창업자인 신재민 트릴리온랩스 대표(31)는 네이버 시절 ‘하이퍼클로바X’ 개발에 참여하면서 국내 AI 기술에 혁신이 필요하다는 점을 뚜렷하게 느꼈다. 대규모 인원이 투입되는 개발 방식은 비용이 많이 필요할 뿐 아니라 의사결정 속도도 느릴 수밖에 없다. 무엇보다 영어에 비해 글로벌 데이터가 현저히 적은 한국어를 학습시켜 성능을 높이는 데 한계가 있다는 점을 발견했다. 이 같은 문제를 해결하기 위해 창업한 회사가 트릴리온랩스다. 신 대표를 만나 국내 AI 산업의 현주소와 회사의 비전을 들어봤다.

A. 첫째는 독자적인 기술력이다. 특히 언어 간 상호학습 시스템(XLDA) 기술을 통해 영어 데이터에서 한국어를 효율적으로 학습시켰다. 데이터가 적은 언어뿐 아니라 과학·의료 등 전문 분야에 매우 효과적인 기술이다. 둘째는 소수 정예 개발 문화다. 그래픽저장장치(GPU)가 연산 대부분을 담당하기 때문에, 인원수보다는 핵심 인력의 집중력이 요구된다. 오픈AI도 5명 내외 소규모 인원으로 시작했듯이, 트릴리온랩스도 소규모 팀이 빠르게 결정하고 집중할 수 있는 구조를 만들었다.
Q. 한국형 LLM을 개발하는 데 영어 데이터 학습 비중을 높인 이유는.
A. 중요한 건 ‘똑똑한 AI’를 만들어야 한다. 국내 기업이 주로 한국어 데이터 학습에 집중할 때, 트릴리온랩스가 영어 학습 비중을 90%로 높인 이유는 AI 지능 자체를 최대로 끌어올리기 위해서다. 전 세계 정보의 절반 이상은 영어로 돼 있다. 영어를 학습하지 않고서는 AI가 세상의 방대한 지식을 온전히 습득하기 어렵다. 점차 한국어 비중을 더 낮춰갈 계획이다. 한국에 필요한 똑똑한 AI를 만들겠다는 목표다. 한국어만 잘하는 AI를 만드는 건 아니다.
Q. 한국어 데이터 학습 비중이 10%에 불과한데도 한국어 성능이 뛰어나다.
A. Tri-21B는 한국어 언어 이해, 수학, 코딩 등 고난도 추론 중심 벤치마크에서 알리바바 ‘큐웬’, 메타 ‘라마3’, 구글 ‘젬마’ 등 글로벌 대표 중형 모델과 견줄 만한 성능을 보인다는 평가를 받는다. 특히 한국어 성능은 글로벌 모델 대비 월등히 높은 점수를 받았다. 한국어를 처음부터 학습해 한국의 사회·문화적 배경이나 맥락을 잘 이해하고 있어 가능한 성과다. 이후 한국어 데이터 부족 문제를 영어 데이터에서 학습하며 성능을 높이는 방식이다. XLDA 기술을 통해 엄청난 양의 한국어·영어 ‘합성 데이터’를 직접 만들어 넣는 것과 유사한 효과를 냈다.
Q. 글로벌 AI 기업과의 경쟁을 위한 차별화 전략은.
A. 아직 AI 산업은 초기 단계다. 글로벌 빅테크가 동북아 작은 나라인 한국과 한국인, 한국어를 위한 AI를 발전시킬 생각을 하지 않는다. 그렇다면 우리나라는 선택권이 완전히 사라지거나 AI 산업 물결에서 소외될 수밖에 없다. 이 부분이 거대 AI 기업과 태생부터 다른 지점이다. 거대 기업이 놓치거나 중요하게 생각하지 않는 특정 언어권, 문화권, 산업에 특화된 AI 모델을 밑바닥부터 개발할 수 있는 기술력 확보가 중요하다. 그 시장에서 누구도 따라올 수 없는 압도적 경쟁력을 가질 수 있다.
Q. 목표는 무엇인가.
A. 회사가 증명해야 할 부분이 많다. 처음에는 한국에서 독자적인 LLM 모델을 왜 만드냐는 질문을 많이 받았다. 그런데 1년도 안 돼 모델을 만들고 나니, 이제는 정말 트릴리온랩스가 한 게 맞냐는 의심의 눈초리를 받는다. 일반적으로 단기간에 소수 인원으로 개발이 어렵기 때문이다. 기술이나 사업적으로 더 성과를 보여줘야 이런 의심이 줄어들 것으로 생각한다. 장기적으로는 초지능 AI를 완성해 우리나라 국민에게 가장 사랑받는 AI로 키우고 싶다. ‘언제 어디서든 사용할 수 있는 AI다’ ‘이 AI 없었으면 어떻게 살았을까 상상이 안 간다’는 말을 듣고 싶다.
Copyright © 매경이코노미. 무단전재 및 재배포 금지.
- 李, 포스코이앤씨 엄포 놓았는데...사망자 최다 건설사는 이곳 - 매일경제
- 마포도 3~4억 뚝…집값이 길을 잃었다? - 매일경제
- 5년도 못 버틴다...저연차 교사 퇴직 31% 증가 [국회 방청석] - 매일경제
- “이제 비과세·감면 없다”…정부 증세 기조 본격화? - 매일경제
- 추가 부동산 대책 어떤 게 나올까...1주택자 전세대출 규제 카드 ‘만지작’ [김경민의 부동산NOW]
- “어느 바보가 국장하나”…뿔난 개미들 양도세 이어 분리과세 압박 - 매일경제
- 개포우성7차 수주 경쟁 뜨겁네...삼성물산 vs 대우건설 “양보 못해” [김경민의 부동산NOW] - 매일
- 매물로 나온 디시인사이드...예상 매각가 무려 2000억? - 매일경제
- 러브버그 없어지니…산림 훼손하는 ‘해충’ 대벌레 대거 출몰 - 매일경제
- 조선업 호황이라며...HD현대중공업 투자의견 ‘하향’, 왜? - 매일경제