[Interview] 삼성·SK·LG가 쓰는 중소형 언어 모델 만든 포티투마루 김동환 대표 | “특정 분야 학습해 정확도 높여…유럽 시장 문 두드린다”
챗GPT 같은 인공지능(AI) 챗봇을 한번쯤 이용해 봤을 것이다. 대규모 언어 모델(LLM) 기술이 적용된 챗봇을 활용하면 질문에 대한 답을 빠르고 효율적으로 얻을 수 있다. 하지만 잘못된 사실을 사실인 것처럼 답변하는 일도 심심치 않게 발견할 수 있다. 1999년 인터넷 포털 엠파스에서 자연어 검색엔진을 개발한 1세대 개발자이자 이 시장에서 약 25년간 내공을 쌓은 김동환(48) 포티투마루 대표는 최근 서울 서초구 포티투마루 사무실에서 진행된 인터뷰에서 “개인이 챗봇을 사용할 때는 검색 결과가 일부 틀려도 큰 문제가 없겠지만, 기업은 정확도가 생명”이라며 “포티투마루가 LLM처럼 방대한 데이터를 다루기보다 특정 분야만 깊게 학습해 정확도를 높인 중소형 언어 모델(sLLM)을 선보인 이유”라고 말했다.
김 대표는 인생의 절반가량을 언어 모델 개발과 함께했다고 해도 과언이 아니다. 그는 엠파스에 이어 2007년에는 SK커뮤니케이션즈에 합류해 검색사업 본부장을 맡았다. 그는 개발자로서 검색엔진 시장의 성장을 바라보면서 두 가지 한계점을 느껴 AI에 대한 관심을 키웠다고 한다. 그는 “포털 검색창에 어떤 키워드를 입력하면, 키워드가 포함된 텍스트 여러 개를 나열해 보여줄 뿐 읽는 즉시 이해할 수 있도록 요약해서 보여주지는 못한다”며 “검색 결과 리스트를 사용자가 일일이 클릭해 확인해야 하는 것도 번거롭다고 생각해 결국 해답은 AI가 제공해주겠구나라는 생각을 했다”고 말했다.
김 대표가 창업을 마음먹은 것은 2017년 AI 열풍이 불면서다. 김 대표는 “AI에 줄곧 관심이 있었지만 상용화는 한참 멀었다고 생각했다”면서도 “AI를 개발하는 기업이 점차 늘고 시장도 커져 드디어 AI를 상용화할 시기가 왔다고 느꼈다”고 회상했다. 김 대표는 평소 친분이 있던 검색엔진 개발자 4명과 AI 개발을 시작하며 그해 ‘포티투마루’를 창업했다.
포티투마루라는 사명은 김 대표가 평소 즐겨 읽었던 ‘은하수를 여행하는 히치하이커를 위한 안내서’라는 공상과학(SF) 소설에서 따왔다. 작품 속 한 인물이 “우주의 모든 것에 대한 답을 알려달라”고 슈퍼컴퓨터인 ‘딥소트’에 묻자 “42”라는 대답이 돌아왔다. ‘마루’는 ‘정상’을 뜻하는 순우리말이다. 업계를 선도하고자 하는 김 대표의 의지를 담은 것이다. 김 대표는 “소설에도 알려지지 않았고 작가도 현재는 작고한 상태라 ‘42’의 의미는 아직도 잘 모른다”면서 “다만 이용자가 묻는 모든 질문에 답하고 싶다는 의지를 가장 간결하게 표현할 수 있을 거 같아 회사 이름에 넣었다”고 말했다.
언어 모델에 정확한 자료 학습시켜 주는 RAG 기술 강점
포티투마루는 설립 이래로 sLLM인 ‘LLM42’와 검색 증강 생성(RAG) 기술인 ‘RAG42’ 개발에 몰두해 왔다. RAG는 AI가 방대한 양의 데이터에서 LLM이 필요로 하는 최적의 정보만 도출하는 기술을 말한다. 가령 LLM42가 금융 기업에 공급되는 경우에는 금융에 대한 내용만 학습하고 응답하게 된다. 발전된 RAG 기술이 챗봇에 적용될수록 데이터에 대한 AI의 이해도가 높아져 정확하고 맥락에 맞는 구체적인 답변을 할 수 있게 된다. 이 같은 방법으로 LLM을 활용한 챗봇에서 발생하는 환각(사실이 아닌 것을 사실인 것처럼 제공하는 것) 현상을 최소화할 수 있다.
김 대표는 sLLM이 정확도뿐 아니라 가성비 측면에서도 장점이 많다는 점을 강조했다. 그는 “LLM은 환각 현상으로 응답 정확도가 80%대에 머무르는 반면 sLLM은 학습한 분야에 대해선 100%에 가까운 정확도를 보인다”며 “sLLM은 학습시켜야 하는 데이터도 적어 기업 입장에서는 기존 LLM보다 저렴한 비용에 구매할 수 있다”고 말했다. 이어 “기업에서 LLM을 활용한 챗봇을 도입하는 데 수백억원을 써야 하지만, sLLM을 도입하는 데는 수십억원 정도만 사용하면 돼 90%가량 더 저렴하다고 볼 수 있다”고 덧붙였다.
하지만 창업 초기에는 아직 AI를 생소해하는 사람이 많아 고객사를 확보하는 과정이 결코 순탄치 않았다고 김 대표는 회상했다. 한번은 그가 한 고객사 관계자 앞에서 LLM42가 적용된 챗봇을 시연하자 “챗봇이 거짓말을 하는 것 아니냐” “사람이 AI인 척을 하고 대신 대답하는 것이 아니냐”는 의심 섞인 말이 돌아오기도 했다. 하지만 김 대표는 좌절하지 않고 발로 뛰어다니며 끊임없이 LLM42의 성능을 보여줬다. 그는 “오픈AI가 개발한 챗GPT 등장으로 AI에 대한 관심이 커진 덕분에 고객사를 늘릴 수 있었다”고 말했다. 김 대표의 오랜 내공과 노력이 시기가 맞물려 유의미한 결과를 낸 셈이다.
창업 당시 단 2곳에 불과했던 포티투마루 고객사는 올해 기준 80여 곳으로 늘었다. 삼성전자, LG유플러스, KT, SK이노베이션, 한화오션, 농협은행, 기아 등 고객사가 속한 산업군도 다양하다. 고객사들은 포티투마루의 기술을 공급받아 내부망용 챗봇 등을 만드는 데 활용한다. 김 대표는 “전문적인 분야 데이터를 풍부하게 학습했을 뿐만 아니라, 회사 내부 자료도 빠르게 습득하고 업무 효율을 높여줘 고객사의 반응도 긍정적”이라고 했다. 독일상공회의소는 2019년 포티투마루의 LLM42를 높게 평가해 ‘혁신상’을 수여하기도 했다.
회사가 성장하며 포티투마루의 사업 모델에 관심을 가진 투자자들도 늘기 시작했다. 포티투마루는 2020년 8월 KDB산업은행으로부터 20억원 규모의 투자를 받았다. 2021년에는 하나금융그룹, IBK기업은행, 하나카드 등 금융권으로부터 시리즈A 전략적 투자를 유치하는 데 성공했다. 김 대표를 포함해 5명으로 출발했던 포티투마루는 현재 직원 수가 70명까지 늘었다.
대화형 챗봇 ‘사이트 버니’ 공개…유럽 시장 공략 박차
김 대표는 앞으로 LLM42를 기반으로 한 챗봇으로 유럽 시장 공략에 박차를 가할 계획이다. 최근 포티투마루는 누구나 접속할 수 있는 홈페이지 형태의 대화형 챗봇 ‘사이트 버니’를 유럽 시장에 공개했다. 현재는 고객사가 B2B(기업 간 거래) 위주지만, B2C(기업과 소비자 간 거래) 영역까지 사업을 확장해 보겠다는 전략이다. 김 대표는 “유럽은 아직 자체 언어 모델을 개발하는 시도가 많지 않아 우리가 충분히 개척 가능하다고 느꼈다”며 “목표를 이룰 때까지 직원들과 함께 끊임없이 서비스를 발전시키고 싶다”고 말했다.
Copyright © 이코노미조선. 무단전재 및 재배포 금지.