[쫌아는기자들] 젠젠에이아이, AI 학습을 위한 AI 합성 데이터를 만들다
@주3회 발행하는 뉴스레터 [쫌아는기자들] 입니다. 전문은 유료 구독자에게 공개. 유료 가입(https://page.stibee.com/subscriptions/158656). 일부 보는 무료 가입(https://page.stibee.com/subscriptions/143087)
@그때 투자(나는 그때 투자하기로 했다)에선 현업 투자자가 왜 이 스타트업에 투자했는지를 공유합니다.
2023년은 생성형 AI라는 키워드의 한 해였다. ChatGPT를 위시한 수많은 거대 언어 모델과 Stable Diffusion과 같은 이미지 생성 모델들의 출시 이후로 새로운 모델들이 지속적으로 쏟아져 나왔고, 생성형 AI 관련 초기 스타트업도 미국과 한국을 막론하고 다양한 사업 모델을 가지고 시장에 등장하였다. 사실 투자를 하는 입장에서 이미 이렇게 Hot 해져버린 영역을 투자하는 것은, 기업 가치 측면에서나 회수 타이밍 측면에서 다소 난감한 부분이 없지 않다. 반대로, 그렇다고 해서 이렇게 뜨거운 영역을 투자하지 않고 지나치는 것 역시 큰 리스크이기도 하다. 게다가 더 판단을 어렵게 하는 것은, AI scene은 치열한 경쟁 하에 지속적으로 새로운 기술들이 나오고 세상을 흔들어 놓고 있다는 점이다. 생성형 AI 영역에 투자하는 많은 심사역들이 유사한 고민을 했으리라 생각해본다. “어떤 AI 스타트업에 투자해야 하는가?”
어찌됐든 딥러닝 AI 시장은 빠르게 성장하고 있다. 이 말은 학습을 위한 데이터셋 또한 함께 그 수요가 증가한다는 것이고, 이러한 데이터를 우수한 퀄리티로 선제적으로 확보한 기업들, 이를 테면 테슬라와 같은 회사들이 타 경쟁사들 보다 기술적, 사업적으로 메리트를 가져가고 있다. 하지만 모두가 테슬라와 같이 양질의 데이터를 충분히 확보할 수는 없다. 조사에 따르면 2019년 미국의 AI 기업 대상 설문에서 96%의 기업이 AI 학습용 데이터 관련 문제점들을 겪고 있다고 응답하였다고 한다. 데이터 수집과 가공, 테스트에 대한 이슈는 모든 AI 기업들이 가지고 있는 숙제다. 특히, 자율주행으로 대표되는 비전 AI 개발에 있어서는 이러한 데이터 관련 이슈가 부각되며, 여러 상황이 복잡하게 인식되는 자율주행 환경으로 인해 글로벌 대형 OEM들도 데이터 문제를 쉽게 해결하지 못하고 있다. Rare & Critical case에 대한 학습 데이터는 늘 구하기 어렵다.
◇부족한 데이터, 2D 합성 이미지 데이터를 생성한다면?
이 문제를 해결할 수 있는 가장 좋은 방법은 가상으로 합성 이미지를 생성하여 데이터의 부족 문제를 해결하는 것이다. 이러한 가상 이미지 기법을 기존 이미지의 변환, 합성, 완전히 새로운 이미지의 생성을 포함한다. 실제로 산업계에서는 3D 렌더링을 통한 이미지를 합성하여 적용하는 시도가 이어져 왔다. 그러나 생각보다 실제 합성 이미지 기반 Vision AI 학습 시 충분한 성능이 나오지 않았고 이로 인해 데이터 문제는 쉽게 해결되지 않는 문제로 남아 있었다.
젠젠에이아이는 2D 합성 이미지 데이터를 생성하여 자율주행용 Vision AI 학습에 필요한 데이터 소스를 가상으로 만들어 공급하겠다는 목적에서 시작되었다. 조호진 대표는 자율주행 업체인 스트라드비전사의 초기 핵심 R&D 멤버로 자율주행과 Vision AI, 그리고 이미지 데이터 처리에 대한 높은 이해도를 가지고 있으며 시장의 데이터 관련 문제점들을 경험하며 이를 해결하기 위해 ‘22년 초 젠젠에이아이를 창업하였다. 젠젠에이아이의 합성 이미지 생성 접근법은 기존의 3D가 아닌 2D 방식에서 출발한다. 2D 합성 이미지라 하면 잘 알려진 기법들이 몇 가지가 떠오른다. 유사 이미지를 생성하는 방식인 GAN 혹은 최근 등장하고 있는 Stable diffusion과 같은 생성형 이미지 생성 모델을 활용하는 경우인데, 물론 기존 foundation model을 그대로 사용하는 경우 실제 이미지와 유사한 원하는 결과를 생성하기가 거의 불가능한 문제가 있다. 학습을 위한 2D 이미지 생성이 어려운 이유는 첫 번째로 기본적인 이미지 생성 기법들을 잘 다뤄야 하고, 두 번째로 카메라 특성 및 후처리와 같은 이미지 프로세싱 역량이 있어야 하며 세 번째로는 특정 도메인에서 어떤 데이터가 어떻게 학습 성능을 높일 수 있는지에 대한 노하우, 즉 도메인 전문성이 필요하기 때문이다.
젠젠에이아이는 이러한 3가지 기술 역량과 전문성을 갖추고, Vision AI와 데이터 문제를 해결할 수 있는 최고 수준의 AI, 컴퓨터 비전, 이미지 프로세싱 전문가들로 구성된 팀이다. 특히 조호진 대표는 세계 최고 수준의 학회에 다수 논문을 게재하고, 다수의 특허를 출원하였고 다양한 제품 개발 경험을 가지고 있을 뿐 아니라 자율주행 도메인에 대한 이해가 깊어 이 기술 비즈니스에 가장 적합한 사람이라고 생각한다. 또한, 여동훈 CTO의 경우도 연구 역량과 실적이 우수할 뿐만 아니라 자율주행 스타트업과 금융사에서 AI 연구 그룹장을 이끌면서 얻은 다양한 경험을 기반으로 기술 고도화와 제품 개발을 잘 리드하고 있다.
◇글로벌로 나갈 버티컬 AI 스타트업
젠젠에이아이는 여러 요소 기술에 대한 개발이 마무리 단계에 있으며 이를 바탕으로 다양한 자율주행/ 방위산업 회사들과 다양한 프로젝트들을 진행하고 있다. 작년 말에는 미국의 한 자율주행 회사와 첫 번째 데이터 공급 계약을 체결한 바 있으며 이후에 후속 계약 및 다양한 회사들과 추가적인 논의가 이어지고 있다. 최근 주목할 만한 영역은 방위산업 영역이다. 방산 데이터는 일반적인 데이터도 구하기가 어렵지만, 비전 AI 도입이 반드시 필요한 분야이다. 그러나 자율주행 영역과 같이 Tier-2와 같은 스타트업이 부재하여 대기업에서 직접 비전 AI 개발을 해야하나 AI 전문인력이 많지 않아 젠젠에이아이와 같은 회사들이 데이터 공급 뿐만 아니라 직접 가상데이터를 활용한 비전 AI 솔루션을 공급할 수 있는 길도 열리고 있다. 특히 보수적인 도메인 특성 상 한 번 신뢰 관계를 맺게 되면 장기적인 파트너가 될 수 있을 것이라고 기대하고 있다. 이러한 시장의 많은 수요에 힘입어 향후 1~2년 안에 기술적인 진보뿐만 아니라 사업적인 성과도 상당히 주목할 수준으로 올라와 줄 것이라고 투자자로서 믿고 있다.
“어떤 AI 기업에 투자해야 하는가”로 돌아가 보자. 여러 방법론이 있을 수 있겠으나 젠젠에이아이와 같은 Vertical AI 스타트업들 중 어떤 회사를 주목할 것인가라는 관점으로 생각해보면, 새로운 거대 모델이 계속해서 나올지언정 이를 잘 활용하여, 특정 도메인에 빠르게 최적화시키고, 이를 계속 개선해 나가면서 고객이 원하는 밸류를 제공할 수 있는 기업이며 이 과정에서 충분한 기술적 진입장벽을 가져갈 수 있는 회사에 투자하고 싶다는 생각을 하게 된다. 물론 시장의 기회가 커야하는 것은 당연한 전제조건이지만, 젠젠에이아이가 영위하는 사업의 영역은 그 기회의 크기가 크고, 글로벌 진출의 장벽도 없는 가치 있는 기술의 영역이다. 젠젠에이아이는 이렇게 내가 투자하고 싶은 AI 회사의 기준을 만족시킨다고 생각하며, 앞으로도 시장의 흐름에 발맞추어 계속 빠르게 성장할 수 있을 것이라 생각한다.
Copyright © 조선일보. 무단전재 및 재배포 금지.