“언어차별 이렇게 심했어?”…영어 대신 한국어로 질문하니 인공지능 답변 수준이 [더테크웨이브]

황순민 기자(smhwang@mk.co.kr) 2024. 9. 21. 20:36
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

프라나브 미스트리 투플랫폼 창업자 인터뷰

오픈AI가 자금을 조달하면서 인정받은 기업가치가 최근 테크업계 화제가 되고 있습니다.

블룸버그와 파이낸셜타임스에 따르면 오픈AI는 기업가치 1500억달러(약 201조원)으로 65억달러의 자금을 조달하고 있는데요. 이는 당초 투자자들이 오픈AI의 기업가치를 예상했던 1000억 달러를 훨씬 상회한 액수입니다.

오픈AI는 지난해 연간 매출 16억달러를 기록했고, 올해에는 2배 이상인 34억달러를 목표로 하고 있습니다. 일각에선 매출보다 비용이 훨씬 높은 오픈AI의 사업 구조를 지적하기도 합니다.

AI 학습에 많은 비용이 들고, 직원이 1700명이 넘는 만큼 인건비도 큰 부담이 될 수 있다는 것이죠. 테크 전문 매체 디인포메이션은 올해 오픈AI의 적자가 50억달러에 달할 수 있다고 전망을 내놓기도 했습니다.

‘인공지능(AI) 거품론’에도 첨단 AI 모델을 만드는 기업들의 경쟁은 지속되는 듯 합니다. 작년부터 AI 밸류체인 전반에서 기업들이 높은 가치를 인정 받았다면, 올 하반기부터 내년까지는 시장의 옥석가리기가 심화할 것이라는 전망도 있습니다.

단순히 AI라는 트렌드에 올라타기보다는 사업과 기술 관점에서 ‘엣지’를 찾아내는 회사가 살아남을 수 있다는 것이죠.

투플랫폼 회사로고. 투플랫폼
이번주 <더테크웨이브>에서는 과거 삼성의 ‘S급인재’로 잘 알려진 프라나브 미스트리 투플랫폼 창업자(대표)를 만나 치열한 경쟁속에서도 AI 분야 창업에 나선 이유와 현재 AI 업계의 트렌드에 대해 들어봤습니다.

투플랫폼은 언어 격차를 줄이고 AI 활용에 있어 누구나 최상의 결과를 얻게 하는 것을 목표로 하고 있는 스타트업입니다. 미스트리 대표는 “모두를 위한 AI를 만들고, AI와 인간의 상호작용을 재정의한다는 미션을 위해 일하고 있다”고 강조했습니다.

다음은 일문일답.

AI, 영어 데이터에 대한 편중 존재
프라나브 미스트리 투플랫폼 창업자. 투플랫폼
-현재 AI 시장의 페인포인트가 무엇이라고 보는가.

=영어 데이터에 대한 편중이다. 전 세계에서 영어를 사용하는 인구는 19%에 불과하지만 빅테크 중심으로 개발된 AI 모델들은 영어 위주의 데이터로 만들어졌다.

같은 질문이라도 영어로 질문했을 때와 다른 언어로 물었을 때 답변 퀄리티에 차이가 있다. 비영어권 국가 사용자들은 낮은 품질의 답변을 얻은 구조다. 우리가 자체 모델 ‘수트라((SUTRA)’를 개발한 이유이기도 하다. 우리의 미션은 ‘모두를 위한 AI’에 있다.

-소수 빅테크가 AI 시장을 장악하고 있다는 문제의식도 커지고 있다. 비영어권 국가에 집중하면 기회가 있다고 보는가.

=비영어권 시장은 크고 다양하지만 분열돼 있는 특징이 있다. 그러한 측면에서 비영어권에서의 LLM(대규모언어모델) 개발과 생성AI 분야에서 성장 기회가 분명히 존재한다.

-스타트업 입장에서 빅테크와 경쟁하기 위해 어떤 ‘엣지’를 내세우고 있는가.

=다국어 능력과, 비용 효율화다. 수트라는 합리적인 가격에 준수한 성능으로 시장을 공략하고 있다. 한국어, 영어, 스페인어, 프랑스어, 독일어, 힌디어, 구자라트어, 타밀어 등 50개 이상의 언어를 지원한다. 또 비영어권 AI모델의 성능을 비교하는 ‘NMLU’ 벤치마크에서 선두권 성적을 기록하고 있다. 무엇보다 저렴한 토큰 비용이 경쟁력이다.

투플랫폼이 만든 ‘수트라 포 엔터프라이즈’. 투플랫폼
-값싸면서도, 준수한 성능의 모델. 실제로 가능한가?

=비결은 아키텍처에 있다. 통상 LLM이 언어와 개념을 동시에 학습하는데 듀얼 트랜스포머 아키텍처로 두 과정을 분리해 필요한 부분만 익힌다는 아이디어다. 듀얼 트랜스포머 아키텍처는 개념 학습과 언어 학습을 분리시킨 구조를 의미한다. 이미 학습된 개념에 언어만 대입시키는 방식이다.

한 가지 개념에 단어를 1대1로 대입시키는 기존 ‘트랜스포머 아키텍처’를 보완한 것이다. 저사양의 그래픽처리장치(GPU) 같은 적은 에너지로도 LLM을 구동할 수 있게 되는 것이다. 또한 다양한 언어 데이터셋으로 만들어진 토크나이저를 사용함으로써 기존 LLM에 비해 적은 양의 토큰만으로도 빠르면서도 정확하고 더 많은 양의 다국어를 처리하는 것이 가능하다.

-기업용 상품도 내놨다. 어떤 의도인가.

=‘수트라 포 엔터프라이즈’는 고객사의 다양한 요청에 특화해 개발됐다. 무엇보다 AI를 도입하려는 기업의 부담을 대폭 낮춰주려는 의도다. 간단한 API를 통해 ‘MaaS(Model as a Service)’ 형태로 제공된다. 대화형 AI 애플리케이션을 개발할 수 있도록 총 세 가지의 언어 모델을 통합해 지원하는 것이 특징이다.

앞서 얘기한 ‘듀얼 트랜스포머’ 아키텍처를 구축해 현재 지원하는 50여개의 언어 외에 추가적인 확장도 얼마든지 가능하다. 낮은 사양의 GPU로도 구동할 수 있다는 점 또한 합리적인 금액의 모델을 찾는 기업 고객에게 어필이 가능할 것으로 본다.

-자체 개발 모델을 만들었다. 이를 활용해 어떤 경영 전략을 구가할 생각인지?

=투플랫폼은 수트라의 투트랙 활용을 구상하고 있다. 먼저 높은 ROI(투자 대비 수익)를 바탕으로 기업 파트너와의 협업을 추진한다. 수트라는 성능 면에서는 오픈 AI의 최신 모델인 GPT-4.0에 미치지 못하지만, 가격과 에너지 효율 측면에서 확실한 경쟁력을 확보했다는 판단이다.

또한 토큰 처리 속도 테스트와 특정 벤치마크에서도 타 모델보다 높은 성적을 거둬 성능을 객관적으로 인정받았다. 적은 투자로 높은 효과를 거둘 수 있어 생성 AI 도입을 원하는 기업들에게 매력적인 선택지가 될 수 있다고 본다.

동시에 자사 서비스인 AI 소셜앱 재피(ZAPPY)와 신개념 대화형 검색 엔진 지니야(Geniya)의 성능 향상에도 수트라를 적극 이용한다는 계획이다.

작은 스타트업이라도 AI엔 원칙 필요
-AI가 큰 변화를 가져올 수 있을까.

=그렇다. AI는 많은 것들의 지형 자체를 바꿀 기본 기술이다.

-한국에 관심을 두고 있는 이유는 무엇인가.

=젊은 세대의 롤모델이 한국이기 때문이다. 한국 문화와 한국인이 실제로 매우 혁신적이고 그들이 함께 새로운 것을 성장시킬 수 있다고 믿는다.

-네이버도 투플랫폼에 투자했다. 어떤 협력이 가능한가.

=네이버는 자신만의 데이터센터를 가지고, 스스로 서비스를 운영하고 있다. 반면 투플랫폼은 비용 효율화에 더 초점을 맞추고 있기 때문에 다른 종류의 혁신이 필요하다. 양사가 함께하면 서로 배울 수 있다고 믿는다.

-‘책임있는 인공지능 원칙’을 제정한 이유는.

=글로벌 빅테크는 물론 작은 스타트업이라도 AI를 다루는 기업이라면 누구나 그 영향력을 인지하고 윤리적 개발과 사용에 최선을 다해야 한다고 생각하기 때문이다. 우리가 만든 여섯 가지의 윤리 원칙이 AI 기반 서비스와 제품을 제공하는 자사의 모든 사업 방향에 중요한 길잡이가 될 것이다. 인간 중심, 공정성, 책임성, 안전성, 보안성, 지속적인 연구와 개선 등 항목으로 구성했다.

삼성 떠나 창업한 이유는 ‘도전’
-대기업을 떠나 창업한 이유는.

=대기업들은 사람들이 (조직을) 떠나지 않도록 유지시켜주는 타이틀을 주기도 하고, 많은 인센티브를 주기도 한다. 그럼에도 누군가는 다른 사람을 위해 새로운 씨앗을 심어야 한다는 사명을 느꼈고, 행동에 옮기게 됐다.

-스타트업 창업자의 삶은 어떤가.

=스타트업의 여정은 결코 쉽지 않다. 하루에 25시간씩 일하고 있는 느낌이다. 하지만 꿈을 꾸고 있기 때문에 편안한 삶을 살 수 없다. 무엇인가를 만들고 싶다면 도전을 해야 한다. 단연 이제까지의 경험 중 가장 흥미롭고, 즐거운 여행이라고 할 수 있다.

-앞으로 비전은?

=수트라는 영어로 훈련된 AI 모델로 인해 발생하는 언어 격차를 해소한다. 또한 훈련된 말뭉치 데이터에서 벗어나 실시간 정보로 지식을 확장한다는 의의가 있다.

우리는 모두를 위한 AI를 만들고, AI와 인간의 상호작용을 재정의한다는 미션을 위해 일하고 있다. AI의 대중적 접근성을 높인 수트라가 목표 달성에 중요한 발판이 될 것이다.

미스트리 대표는 누구
미스트리 대표는 미국 매사추세츠공대(MIT)랩 출신입니다. 2012년 삼성전자에 입사할 당시 ‘천재 과학자’로 화제를 모은 바 있습니다.

2019년 9월부터는 삼성리서치아메리카(SRA) 산하 연구소인 스타랩스 CEO에 올랐습니다. 스타랩스는 삼성전자의 인공인간 프로젝트 ‘네온(NEON)’을 개발한 조직입니다. 그가 2021년 “새로운 도전을 시작하겠다”며 삼성을 떠난 후 창업한 회사가 ‘투플랫폼’입니다.

투플랫폼은 올해 초 시드 라운드를 마무리했습니다. 지오플랫폼과 네이버 등이 총 2000만 달러를 투자했습니다.

미스트리 대표와 삼성에서 웨어러블 기기 개발과 증강현실(VR), AI 프로젝트 등을 함께한 인원들과 마이크로소프트(MS), 소니 등 글로벌 기업 출신 인재들이 속속 회사에 합류했습니다. 유튜브 공동 창업자인 스티브 첸도 자문단으로 합류해 힘을 보탰습니다.

<황순민 기자의 ‘더테크웨이브’> 연재를 시작합니다. 기술(Tech)이 세상을 더 나은 곳으로 만들리라 믿습니다. 혁신적인 서비스로 인류를 진보시키는 최신 기술 동향과 기업 사례를 소개하겠습니다. 네이버 기자페이지를 구독하시면 다음 기사를 쉽게 받아보실 수 있습니다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?