류현정의 더다이브 <26> | [Interview] 알리 고드시 데이터브릭스 공동 창업자 겸 CEO | 이란에서 실리콘밸리로…57조원 기업 만든 ‘우연한 백만장자’
데이터 수집과 관리의 궁극 종착점은 인공지능(AI)이다. 기계(컴퓨터)가 대량의 데이터를 학습하면 사람의 질문에 척척 답도 하고 추론도 해낸다. 오픈AI가 채팅형 AI ‘챗GPT’로 대중을 깜짝 놀라게 하는 사이 B2B(기업 간 거래) 시장에서는 클라우드 기반의 데이터 관리·분석 업체 데이터브릭스(Databricks)가 놀라운 AI 속도전을 펼쳤다.
데이터브릭스는 지난 6월 모자이크ML을 13억달러(약 1조7500억원)에 인수한 데 이어 9월에는 생성 AI(Generative AI) 시대 총아로 떠오른 엔비디아의 전략적 투자까지 끌어냈다. 조만간 개화할 기업용 AI 시장에서 경쟁사에 한 뼘의 땅도 섣불리 내줄 수 없다는 기세였다. 마지막 투자 라운드에서 데이터브릭스는 430억달러(약 57조8000억원)의 기업 가치를 인정받았다. 창립 10년 차에 불과한 스타트업이 한국 최대 포털 네이버의 시가총액(30조~40조원)을 뛰어넘은 것이다.
데이터브릭스가 엔비디아 등으로부터 5억달러(약 6700억원) 규모의 투자 유치를 공식 발표한 9월 14일(현지시각) 알리 고드시(Ali Ghodsi) 공동 창업자 겸 최고경영자(CEO)를 화상으로 만나 이 회사의 전략을 들었다. 고드시는 이란계 스웨덴인으로 서른 살이 될 때까지 미국 실리콘밸리 땅을 밟아 본 적 없는 유럽의 컴퓨터 과학자였다.
총투자 유치액 5조원 넘어
기자의 첫 질문은 ‘그 많은 투자 유치금을 어디에 쓸 것이냐’였다. 데이터브릭스는 이미 36억달러(약 4조8000억원)가 넘는 투자금을 유치해 놓은 상태였다. 이번 투자까지 더해져 데이터브릭스의 누적 투자 유치액은 41억달러(약 5조5000억원)에 달한다.
고드시 CEO는 “사실 데이터브릭스는 현금이 필요한 상황이 전혀 아니었다”면서 “오죽했으면 회사 재무팀이 투자 유치 상한선을 1억달러(약 1300억원) 이내로 제한해 놓았겠냐”고 했다. 그는 “이번 라운드의 핵심은 전략적 투자자로 합류한 엔비디아와 재무적 투자자로 합류한 티 로웨 프라이스 어소시에이츠(T. Rowe Price Associates)”라고 설명했다.
우선, 데이터브릭스는 이번 라운드를 통해 가장 강력한 AI 칩 설계 능력을 갖춘 엔비디아와 전략적 파트너십을 맺게 됐다. 또 미국 최대 펀드 운용사 중 하나인 티 로웨 프라이스 어소시에이츠로부터의 투자를 유치해 향후 기업공개(IPO)에 유리한 포석도 마련했다고 했다. 주요 펀드사들이 해당 기업의 주식을 보유하느냐가 주가 상승과 연결되기 때문이다.
고드시 CEO는 “회계 요건부터 감사 같은 규제 대응까지 데이터브릭스 상장에 필요한 준비는 모두 마친 상태”라면서 “세계경제 위축으로 침체한 증권시장 분위기만 바뀌면 바로 IPO에 나설 것”이라고 했다.
“엔비디아와는 음과 양처럼 움직일 것”
고드시 CEO는 6개월 전부터 젠슨 황 엔비디아 창업자 겸 CEO를 만나 더 저렴하고 더 빠른 생성 AI 구축 방법을 논의해 왔다고 한다. 결국 두 사람은 하드웨어부터 소프트웨어까지 생성 AI에 최적화한 아키텍처를 근본적으로 재설계하는 데 손을 맞잡기로 했다.
고드시 CEO는 “이제 엔비디아와 데이터브릭스는 음(陰)과 양(陽)처럼 광범위하게 협력하게 될 것”이라면서 “특히, 지난 6월 인수한 모자이크ML이 엔비디아 기술팀과 협력하는 주축이 될 것”이라고 설명했다. 그는 AI 모델 개발에서 하드웨어와 소프트웨어의 조화가 중요하다는 것을 강조하기 위해 ‘음양(yin and yang)’이라는 단어를 썼다. 데이터브릭스에 인수된 모자이크ML은 창업 3년 차 기업으로, 데이터베이스(DB)에 AI를 결합하는 기술 개발에 집중해 왔다. 거대하고 값비싼 대규모 언어 모델 대신 기업의 특화 영역에 최적화한 작고 정교한 생성 AI 모델 개발이 이 회사의 목표였다. 고드시 CEO는 나빈 라오(Naveen Rao) 모자이크ML 공동 창업자 겸 CEO도 수차례 만나 “당신이 데이터브릭스의 공동 창업자와 다름없을 것”이라며 피인수를 끈질기게 설득했다. 현재 산업계에서 가장 인기 있는 AI 모델은 메타가 오픈 소스로 공개한 ‘라마(LLaMA)’다. 하지만 데이터브릭스는 아예 다른 아키텍처 모델을 만들어 수개월 내 공개할 예정이다.
“훌륭한 연구자가 최고의 혁신가”
미국 경제 잡지 ‘포브스’는 고드시 CEO를 ‘우연한 백만장자’라고 썼다. 그의 가족은 이란·이라크 전쟁과 불안한 정국(政局) 때문에 비자를 발급해 준 스웨덴의 가난한 동네로 거처를 옮겨야 했다. 1984년 그의 나이 다섯 살 때 일이었다.
스웨덴에서 박사 학위(컴퓨터 공학)를 받은 고드시는 2009년 미국 캘리포니아대 버클리 캠퍼스(UC 버클리) 방문 학자로 왔다가 인생의 큰 전환점을 맞게 된다. UC 버클리 AMP 랩이 주도하던 오픈 소스 프로젝트 ‘스파크(Spark)’에 참여한 게 계기였다. 스파크는 주기억장치(RAM)에서 직접 데이터를 처리하는 ‘인메모리 방식’을 채택, 디스크 기반의 데이터 분석 엔진보다 처리속도가 획기적으로 빨랐다.
소프트웨어의 설계도를 공개하는 오픈 소스 프로젝트가 어떻게 상업적으로도 큰 성공을 거둘 수 있었을까. 고드시 CEO는 두 가지를 비결로 꼽는다. 하나는 전략적으로 클라우드 기반으로 제품을 출시했다는 점이다. 기업용 시장이 클라우드 기반으로 흐르는 점을 잘 포착한 덕분에 아마존, 마이크로소프트(MS), 구글 등 클라우드 대기업들이 데이터브릭스의 유료 제품을 팔아주는 효과까지 누릴 수 있었다. 나중엔 세 기업 모두 데이터브릭스에 직접 투자까지 단행했다.
고드시 CEO는 또 다른 비결로 연구원을 중시하는 기업 문화에 대해 말했다.
“오픈 소스였던 스파크를 상용화하기 위해 20여 명의 대용량 데이터 처리 분야 연구원이 모여 2013년 설립한 회사가 데이터브릭스다. 연구원들이 바로 혁신가들이다. 최고의 대학을 졸업한 연구원을 뽑는 게 우리의 시크릿 소스(secret source)다.”
그는 “내년 데이터브릭스의 서밋(summit)에서 AI를 활용해 성과를 거둔 실제 기업 사례를 보여주겠다”고 했다. ‘우연한 백만장자’의 목소리에서 ‘친절함’ ‘민첩함’ ‘자신감’이 동시에 묻어나왔다.
Company Info
회사명 데이터브릭스(Databricks)
본사 미국 샌프란시스코
사업 기업용 데이터 관리·분석·예측
창업자 알리 고드시, 이온 스토이카 외 6명
설립 연도 2013년
누적 투자 유치액 41억달러 이상
Plus Point
데이터브릭스 vs 스노우플레이크
데이터브릭스와 유사한 기업용 소프트웨어 회사로 스노우플레이크(Snowflake)가 있다. 스노우플레이크는 2020년 9월 뉴욕 증시 상장 당시 워런 버핏이 1956년 포드 이후 64년 만에 투자한 공모주로 큰 관심을 받았다. 데이터브릭스와 스노우플레이크는 이른바 ‘클라우드 네이티브(클라우드 환경의 장점을 최대한 활용해 애플리케이션을 구축하고 배포하는 것)’ 회사라는 점, 대용량 데이터를 처리하는 빅데이터 분석 플랫폼이 주된 사업이라는 점, 비슷한 시기에 창업해 빠르게 성장한 신예 스타라는 점 등의 공통점 때문에 자주 비교된다.
두 기업의 차이점도 많다. 우선 창업자 면면을 보면, 데이터브릭스는 학계 인물들이 주축을 이루고 있다. 초대 CEO였다가 매출 부진으로 이사회에만 남은 이온 스토이카는 UC 버클리 교수로 돌아갔다. 현 CEO인 알리 고드시도 스웨덴왕립공과대 조교수로 재직했었다. 스노우플레이크는 2012년 오라클 엔지니어 출신들인 티에리 크루앙스, 베노이트 다지빌, 데이터베이스 전문가인 마친 조코우스키가 공동 설립한 회사다.
데이터브릭스가 아파치 스파크, 델타 레이크, ML플로우 등 오픈 소스 기반의 개발을 지향하는 반면, 스노우플레이크는 공개되지 않는 자체 아키텍처를 사용한다. 데이터브릭스가 비정형 데이터 처리에 강점을, 스노우플레이크는 정형 데이터 처리에 강점을 보였으나 최근엔 영역 확장으로 두 회사 간 경쟁이 치열해지는 모양새다. 스노우플레이크 시가총액은 상장 후 1000억달러(약 134조6000억원) 넘게 치솟았으나 현재 540억달러(약 72조6000억원) 수준에 머물고 있다.
한편, 2023년 회계연도(2022년 2월~2023년 1월) 기준 데이터브릭스의 매출은 15억달러(약 2조원)를 기록했다. 컴캐스트, 콘데 나스트, H&M, 로레알 등이 주요 고객이다.
Copyright © 이코노미조선. 무단전재 및 재배포 금지.