유펜솔루션, 클릭 몇 번이면 홈페이지 데이터 자동으로 수집 [Let's 스타트업]

조광현 2021. 1. 31. 18:36
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

클라우드 기반 웹 크롤링 솔루션 '스파이더킴'을 운영하는 유펜솔루션은 원하는 웹 데이터를 수집해 주는 스타트업이다. 김재훈 유펜솔루션 대표(사진)는 "크롤링은 검색엔진 로봇을 활용한 데이터 수집 방법"이라며 "스파이더킴에 데이터를 수집하고 싶은 URL을 입력하고 간단한 조작을 하면 엑셀과 같은 다양한 파일 형태로 결과물을 내려받을 수 있다"고 설명했다.

예를 들어 매일경제의 경제 뉴스를 수집하고 싶다면 매일경제 홈페이지에 접속해 경제 카테고리를 클릭하고 해당 카테고리의 웹 주소인 URL을 복사해 스파이더킴에 붙여 넣으면 된다. 이후 필요한 모든 페이지의 자료를 스파이더킴으로 불러올 수 있다. 제목, 날짜처럼 자료에서 보고 싶은 항목을 '추출'하면 항목별로 셀이 구분된 데이터를 엑셀 파일로 생성할 수도 있다.

김 대표는 "스파이더킴은 4000여 개 사이트에 대해 구조를 이미 파악하고 소스를 분석해 놓았다. 이것이 유펜솔루션의 경쟁력"이라고 강조했다. 사용량에 따라 가격을 책정하는 구조이다 보니 가격경쟁력도 높다는 평가다. 유명 웹 크롤링 업체와 비교해 웹 페이지 로딩 시간은 최대 12배 빠르고 데이터 1만 건을 수집하는 데 평균 1시간 더 빠르다는 게 유펜솔루션 측 설명이다.

컴퓨터공학을 전공한 김 대표는 대학생 당시 대학연구소에서 데이터 수집 일을 도우며 일에 관심을 가졌다. 그는 "보고서를 작성하기 위해 데이터 수집을 많이 했던 이전 직장에서도 코드를 짜서 데이터를 자동으로 수집해 업무를 처리해 왔다"면서 "학교 기업뿐만 아니라 많은 곳에서 데이터 수집에 대한 수요가 있을 것이라고 생각해 2018년 5월에 유펜솔루션을 창업했다"고 말했다.

현재 스파이더킴은 베타 버전이며 정식 버전은 5월께 출시할 계획이다. 유펜솔루션은 스파이더킴 개발에 필요한 자금을 마련하기 위해 하반기에 투자 유치를 진행할 계획이다.

[조광현 연구원]

[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?