인공지능 기반 필기 서비스 개발기

회의와 미팅이 잦은 이들의 ‘진짜’ 출근 시간은 오전 9시가 아니라 오후 4시다. 연 이은 만남을 마무리하고 간신히 자리에 앉은 시간이다. 보고서 작성에 앞서 회의록을 정리하다 보면 퇴근은 요원해진다. 야근 후 출근하면 또 다시 회의와 미팅의 홍수에 몸을 던져야 한다.
더플레이토(The Plato)의 임은성(27) 대표는 이 굴레를 끊어내기 위한 힌트를 음성에서 찾았다. 다국어 대화 내용을 인식해서 요약 노트를 생성하는 인공지능(AI) 기반 필기 서비스 티로(Tiro)를 개발한 계기다. 그를 만나 업무 생산성을 획기적으로 높이는 방안에 대해서 들었다.
◇ 한 살 때부터 컴퓨터를 만진 영재의 근황

더플레이토는 AI 노트테이킹 서비스 티로의 개발사다. 대화나 미팅 중 티로를 구동하면 받아쓰기를 넘어 대화 내용을 구조화해 정리해준다. 대화의 핵심을 추린 한페이지 문서와 회의록, 강의노트 등 맞춤형 문서도 생성한다. 이용자는 회의록을 일일이 복기할 필요 없이 구조화된 내용을 참고하거나, 생성된 문서를 다듬기만 하면 된다.
서비스명은 로마의 유명한 정치가이자 웅변가 키케로(Cicero)가 가장 아꼈던 비서 마르쿠스 툴리우스 티로(Marcus Tullius Tiro)에서 따왔다. 바쁜 현대인에게 키케로가 아꼈던 티로 같은 비서를 주고 싶다는 의미를 담았다.

임 대표는 스스로를 프로덕트 가이(Product guy)라고 소개했다. “한 살 때부터 컴퓨터를 만졌어요. 7살 무렵엔 프로그래밍을 독학해서 게임을 만들곤 했죠. 만든 프로그램을 온라인 커뮤니티에 올려서 피드백 받는 걸 즐겼어요. 서울대에 진학해 컴퓨터공학과 수학을 전공했습니다.”
창업으로 커리어를 시작했다. 그동안 개발한 서비스의 수가 그의 나이보다 많다. “사람이 떠날 때 위대한 무언가를 남기는 게 인류에 대한 가장 큰 헌사라고 믿습니다. 지금 운영 중인 티로가 벌써 40번째 제품이에요. 화물 플랫폼, 모빌리티 플랫폼 등 ‘시장에 문제 있다’ 싶으면 일단 솔루션부터 만들고 봤어요. 첫 창업은 영유아 정서 발달을 돕는 헬스케어 제품이었어요. 이후 글로벌 유저 900만명을 보유한 에듀테크 기업에 취업해 AI 엔지니어링과 비즈니스 경험을 쌓았습니다.”

AI가 화두가 되면서 AI 엔지니어가 유망 직업으로 부상했다. 임 대표도 빅테크 취업을 고민했지만, 결국 창업을 택했다. “인간은 5만 년 전부터 대화로 소통해왔어요. 그런데 음성 기술은 아직도 전화기나 축음기 같은 100년도 안 된 기술에 머물러 있죠. 반면 텍스트는 파피루스부터 금속활자, 하이퍼텍스트까지 진화해 왔어요. 음성 기술이 학계에 등장한 건 5년이 채 안 됐어요. 저는 이 기술이 인쇄술 못지않은 파급력을 가질 거라고 확신했습니다. 인쇄술이 사회를 바꿨듯, 음성 기술이 소통 방식을 통째로 바꿔놓을 수 있다고 믿어요.”
연이은 미팅에 정신없이 하루하루를 보냈던 직장 생활에서 아이디어가 떠올랐다. “전 직장에서 미팅이 너무 많았어요. 저녁에 겨우 본업에 손댈 수 있을 정도였어요. 문득, 독일에서 공부하던 친구의 고충이 떠올랐습니다. 독일어와 영어로 수업을 듣고, 그걸 녹음해서 밤에 기숙사에서 다시 듣더라고요. 외국어가 낯선 한국인 입장에서 녹음에 의존하는 건 너무 비효율적이었어요. ‘이건 기술로 해결할 수 있지 않을까’ 하는 생각이 들었죠. 언어 장벽을 넘고, 미팅이나 수업에서도 실시간으로 대화 내용을 확인할 수 있는 솔루션이 꼭 필요하다고 느꼈습니다.”
◇ 대화의 ‘맥락’을 파악해서 내용 구조화

2024년 더플레이토 법인을 설립하고, 실시간 대화 기록 서비스 티로를 개발했다. 일정이 빽빽한 이들을 위한 실시간 대화 기록 및 번역 기능을 제공하는 AI 노트테이커 서비스다. 주 이용자는 다양한 사람들과 만나 중요한 의사결정을 내려야 하는 벤처캐피털(VC), 스타트업 대표, 기업 임원진 등이다. 팀이나 기업 단위로 티로를 도입하는 사례도 늘고 있다.
티로의 핵심은 ‘받아쓰기’가 아니라 ‘구조화’에 있다. “기존 생산성 도구 대부분 음성을 텍스트로 바꿔주는 데 그쳤어요. 텍스트가 틀리면 결국 사용자가 다시 타이핑해야 하죠. 티로는 다릅니다. 대화 내용을 텍스트로 바꾼 뒤, 그 맥락을 읽어 내용을 구조화 합니다. 대화를 1~2분 단위로 주제별로 나눠서 보여주기 때문에 소화하기 쉬워요. 텍스트 원문, 구조화된 내용, 요약본까지 한눈에 볼 수 있죠. PDF나 워드, 링크로도 바로 공유할 수 있습니다. 회의나 교육 끝난 뒤 따로 정리하는 시간을 줄일 수 있어요.”

구조화의 핵심은 ‘맥락’ 파악이다. “티로의 처리 과정은 네 단계로 이뤄져 있어요. 먼저 STT(Speech to Text) 기술로 대화를 텍스트로 바꿉니다. 그 다음 불필요한 말을 걷어내고 고유명사를 정확하게 다듬어요. 이후 맥락을 파악해 내용을 만들어냅니다. 정리된 내용은 주제, 세부 내용이 하나의 구성인 대화 덩어리로 표출됩니다. 티로는 사용자 직업이나 미팅 이력, 도메인, 미팅 유형 같은 정보를 학습해서 이용자의 특성을 인식해요. 고유명사 인식이 틀리면 사용자가 수정할 수 있어요. 이를 학습해서 다음엔 더 정확하게 인식하죠. 이 맥락 이해 능력이 AI 서비스 품질을 좌우하는 핵심 요소입니다. 경쟁 서비스의 정확도가 85%인 반면, 티로의 정확도는 92%에 달해요.”
대화가 끝난 뒤에 가공하는 것이 아니라, 즉시 내용을 정리해 활용도가 높다. “티로는 실시간으로 대화 흐름을 보여줘요. 말 그대로 ‘티키타카’가 가능한 거죠. 집중력이 잠깐 흐떨어졌을 때, 놓친 내용을 바로 확인할 수 있어요. 중요한 수치나 액션 아이템도 중간에 질문하면 바로 찾을 수 있죠. 12게 언어를 지원하고 있어서 한국어, 영어, 일본어가 뒤섞인 다국어 미팅도 문제없습니다. 심지어 피아노 소리, 부스럭거림, 웅성거림 같은 비언어적 소리도 감지해요. 저희가 내건 캐치프레이즈가 있어요. ‘필기는 그만, 대화에만 집중하세요.’”

티로의 활용가능성은 무궁무진하다. “VC들은 주간 회의나 세미나, 스타트업 피칭 같은 자리에서 티로를 자주 씁니다. 난이도 높은 피칭 내용을 정확히 기록하고, 수 차례에 걸쳐 진행된 미팅의 팔로우업 도구로 활용하고 있어요. 해외에서 일하는 분들에게는 언어 부담을 줄여주는 역할을 해요. 외국어가 능숙해도 모국어만큼 편하긴 어렵잖아요. 티로는 그런 상황에서 실시간으로 외국어 대화 내용을 확인할 수 있게 해줘요. 낯선 업무 환경에서 자신감을 가질 수 있죠.”
◇ 인간의 능력을 10배로

2024년 말, 글로벌 시장을 대상으로 공식 론칭한 티로는 빠른 속도로 이용자를 유치하고 있다. 월 매출이 매달 2배씩 성장해, 현재 매월 3만달러(4116만원)의 매출이 발생한다. 재구독률은 80%에 이른다.
바쁜 직업인이라면 누구나 가졌을 문제를 쉽고 직관적으로 해결해 벤처 생태계의 주목도 한 몸에 받았다. 올해 스마일게이트인베스트먼트와 매쉬업벤처스 등 유명 벤처캐피탈로부터 시드 투자를 유치했다. 은행권청년창업재단(디캠프)의 스타트업 육성 프로그램 ‘배치’, 아산나눔재단의 초기 스타트업 미국 진출 지원 프로그램 ‘아산 보이저’ 등 다수의 지원 프로그램에도 선정됐다.

임 대표는 커뮤니케이션 문제가 기업 생산성 문제의 시작점이라고 강조했다. “한 연구에 따르면 기업 리소스의 60%가 커뮤니케이션에 투입된다고 합니다. 이 영역에서 해결해야 할 문제가 많아요. 티로를 사용하면 1시간 미팅 시 약 15분의 시간을 절약할 수 있습니다. 전체 미팅 시간의 25%에 해당하죠. 티로의 고관여 이용자는 일주일에 약 10시간을 벌 수 있어요. 하루 2시간 일찍 퇴근이 가능한 거죠.
인간을 대체하는 것이 아니라, 인간의 능력을 10배 향상시키는 게 목표다. “청각장애인 사회에서 티로가 알려지기 시작했습니다. 여기서 힌트를 얻어 청각장애인 사용자 맞춤형 서비스도 개발하고 있습니다. 이 분들이 적극적으로 피드백을 줘서 감사하게 생각합니다. 음성 기술은 단순한 수단일 뿐이에요. 핵심은 전반적인 업무 효율성을 높이는 것이죠. 자전거가 발명된 후 인간은 적은 힘으로 더 먼 거리를 빠르게 갈 수 있게 됐습니다. 티로를 인간 지능의 자전거 같은 서비스로 만들고 싶습니다.”
/진은혜 에디터
Copyright © 더 비비드