[#Let's 스타트업] CNAI, 세상에 없던 데이터 합성해 인공지능 학습
최근 기자와 인터뷰한 이원섭 CNAI 대표(사진)는 이렇게 말했다. 합성데이터는 실제 데이터가 아닌 AI 학습에 쓰기 위한 목적으로 만들어진 가상 데이터다. 이 대표는 "AI의 세 가지 요소를 데이터, 모델, 시스템이라고 한다면 기업들이 가장 구하기가 어렵고 비용이 많이 드는 것이 데이터"라면서 "데이터가 차지하는 비율이 80% 정도 되는 것으로 분석된다"고 설명했다. AI를 학습시키는 데 쓰이는 데이터 양이 많을수록 AI를 활용한 소프트웨어의 정확도가 높아지지만 데이터를 구하는 것 자체가 비용이 많이 든다. '21세기판 인형 눈 붙이기'라고 하는 데이터 라벨링에 인건비가 높아도 사람이 쓰이는 이유이기도 하다. 이 대표는 "합성데이터를 사용하면 데이터를 모으는 시간과 비용을 줄일 수 있다"면서 "해외에서도 합성데이터 시장이 커지면서 많은 기업이 등장하고 있다"고 설명했다. 'AI.리베리'라는 미국의 합성데이터 스타트업은 2021년 메타(옛 페이스북)에 인수되기도 했다.
합성데이터는 '가짜' 데이터가 아니다. 실제 데이터를 기반해 합성데이터가 만들어지기 때문이다. 예를 들어 빨간색 차량의 측면 사진을 실제 데이터로 가지고 있다면 합성데이터는 이 사진의 색을 바꾸거나 전면·후면 사진으로 바꿔서 만들어낸다.
그는 "합성데이터는 현재 가장 활발하게 적용되고 있는 자율주행이나 로보틱스 분야 외 일반 소매판매 시장, 스마트시티, 국방 영역 등에서 활용 사례가 늘어날 것"이라면서 "다양한 파트너들과 국내외 프로젝트 수행을 통해 합성데이터가 적용 가능한 사업영역을 발굴하는 일에 집중하고 있다"고 밝혔다.
글로벌 정보기술(IT) 시장조사기관 가트너에 따르면 현재 전 세계 합성데이터 시장이 매년 23%씩 성장하고 있으며, 2024년이면 261억달러(약 35조8700억원)에 달할 것으로 전망했다. CNAI는 한국에서 시작해 글로벌 합성데이터 기업으로 성장하는 것이 목표다. 이 대표는 과거 삼성전자에서 개발자로 일했으며, 김보형 최고기술책임자(CTO)도 삼성전자 출신이다. CNAI는 지난 4월 50억원 규모 프리시리즈A 투자를 싱가포르 '센타우리펀드'와 IMM인베스트먼트 등으로부터 유치했다.
[이덕주 기자]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
- 열아홉에 창업해 28조원에 회사 판 청년…뭐 하는 회사기에
- [백문이 불여IT견] 브라더 DCP-T426W 복합기 사용해보니
- 아쿠아시큐리티, 기업용 클라우드 보안 솔루션 출시
- `우영우` 덕 제대로 본 넷플릭스...이용자 반등
- 립체인, 한국음반산업협회와 NFT 사업 업무 협약 체결
- 강경준, 상간남 피소…사랑꾼 이미지 타격 [MK픽] - 스타투데이
- 고려아연 ‘유증 폭탄’ 자충수 되나
- ‘삼남매 母’ 율희, 최민환 ‘성매매 의혹’ 폭로→양육권·위자료 소송 제기 - MK스포츠
- 이찬원, 이태원 참사에 "노래 못해요" 했다가 봉변 당했다 - 스타투데이
- 양희은·양희경 자매, 오늘(4일) 모친상 - 스타투데이