스트라드비젼, '데이터 파이프라인 자동화 시스템' 구축

김태윤 기자 2024. 8. 6. 17:44
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

AI(인공지능) 기반 영상 인식 소프트웨어 'SVNet' 개발 스타트업 스트라드비젼(대표 김준환)이 데이터 파이프라인 자동화 시스템을 구축했다고 6일 밝혔다.

잭 심(Jack Sim) 스트라드비젼 CTO는 "빠르고 안정적인 서비스를 제공하고자 디지털 전환을 가속화하고 있다"면서 "이를 위해 데이터 파이프라인 자동화 시스템을 구축했다"고 말했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

AI(인공지능) 기반 영상 인식 소프트웨어 'SVNet' 개발 스타트업 스트라드비젼(대표 김준환)이 데이터 파이프라인 자동화 시스템을 구축했다고 6일 밝혔다.

데이터 파이프라인(Data Pipeline)은 원시 데이터를 분석하기 쉬운 형태로 변환해 데이터 웨어하우스에 저장하는 전처리 과정이다. 보통 ETL(추출: Extracting, 변환: Transforming, 적재: Loading)을 포함하는 과정으로 진행된다.

SVNet은 복잡도가 높고 정밀 데이터로 학습하기 때문에 ETL 과정을 여러 단계로 세분화했다. 업체는 "전체 과정이 복잡하고 시간이 오래 걸리지만 데이터 품질이 SVNet 성능에 큰 영향을 미치기 때문에 자동화를 도입했다"고 설명했다.

스트라드비젼이 구축한 시스템은 전처리·품질·효율 파이프라인 세 단계다. 이 시스템은 클러스터 서버 기반으로 병렬 처리되며, 모든 데이터는 자체 개발한 데이터 센터에서 처리된다.

'데이터 전처리 파이프라인'에서는 데이터 보정 기술을 개발해 데이터 품질을 개선한다. 고속으로 주행하면서 데이터를 취득하는 특성상 오차가 발생하고 여기서 데이터 품질에 영향을 준다. 이 과정에서 수작업을 최소화하고자 자동화된 파이프라인을 구축해 품질 향상과 비용 절감을 달성했다.

'데이터 품질 파이프라인'은 오류 파악과 수정 과정을 진행해 데이터의 질을 높인다. 데이터 품질을 높이면 같은 양의 데이터로도 성능을 향상할 수 있다. 동일한 데이터양으로도 노이즈를 줄이고 인식률을 개선해 AI 모델 성능을 극대화했다.

'데이터 효율 파이프라인'에서는 AI 모델로 데이터 생성 작업 비용을 낮추고 품질을 높인다. AI 학습 데이터는 주로 수작업으로 생성되는데, 이때 작업자의 투입 시간과 숙련도 차이가 발생한다. 이 같은 문제를 해결하고자 작업자와 협업할 수 있는 AI 모델을 개발했다.

잭 심(Jack Sim) 스트라드비젼 CTO는 "빠르고 안정적인 서비스를 제공하고자 디지털 전환을 가속화하고 있다"면서 "이를 위해 데이터 파이프라인 자동화 시스템을 구축했다"고 말했다. 이어 "지속적인 프로세스 자동화로 운영 비용을 절감하고 리소스 활용을 최적화해 고객에게 더 나은 서비스를 제공할 것"이라고 덧붙였다.

스트라드비젼은 올해 하반기 중 코스닥 상장 심사 신청을 목표로 기업공개(IPO)를 진행 중이다. 코스닥 기술특례 상장을 위한 기술성 평가에서는 'A, A'를 받은 바 있다.

사진제공=스트라드비젼


김태윤 기자 tyoon80@mt.co.kr

Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?