페블러스, AI를 위한 ‘데이터 종합병원’

양재필 매경비즈 온라인기자(sohnsb@naver.com) 2026. 2. 27. 09:45
음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[2025 딥테크 밸류업 프로그램 인터뷰① ] 이주행 페블러스(Pebblous) 대표
진단부터 처방까지 원스톱… 피지컬 AI 표준 데이터 구축
현대차 울산공장 공정 최적화로 비효율성 개선 기대
본 프로그램은 서울창조경제혁신센터(이하 서울창경)가 전국 16개 지역 창조경제혁신센터와 함께 구축한 전국 단위 개방형 혁신(Open Innovation) 플랫폼이다. 해당 기사는 2025 딥테크 밸류업 프로그램에 선정된 기업을 대상으로 진행됐다. 본 사업은 ‘초격차 1000+’, 아기·예비유니콘, TIPS 등 중소벤처기업부의 주요 프로그램 선정팀 DB pool 내에서 대기업과 민간 중심의 오픈 이노베이션 생태계 내에서 스타트업을 추천 기반으로 연결하는 것을 목표로 한다. 이를 통해 유망 스타트업과 대기업 간 수요에 기반한 협력 기회를 신속하게 매칭하고 지원한다. 페블러스는 2025 딥테크 밸류업을 통해 현대자동차와 협업한 기업이다.

글로벌 인공지능(AI) 시장의 패러다임이 ‘모델 성능’ 중심에서 ‘데이터 품질’ 중심으로 급격히 이동하고 있다. 아무리 뛰어난 파운데이션 모델이라도 질이 낮은 데이터를 지속적으로 학습하면 성능 저하와 AI 환각(Hallucination) 현상을 피할 수 없다는 ‘가비지 인, 가비지 아웃(Garbage In, Garbage Out; 쓰레기가 들어가면 쓰레기가 나온다)’의 원칙이 다시금 주목받는 이유다. 특히 최근 중요도가 높아지며 제조, 국방, 모빌리티 등 현실 세계와 상호작용하는 피지컬 AI(Physical AI) 분야에서는 물리 법칙을 거스르지 않는 초고품질의 데이터 확보가 생존의 필수 조건이 되었다.

이주행 페블러스(Pebblous) 대표 <제공: 페블러스>
이러한 흐름 속에서 국내 스타트업 페블러스는 독보적인 행보를 보이고 있다. 정보통신기술(ICT) 분야를 대표하는 국책 연구기관인 한국전자통신연구원(ETRI)에서 20년 이상 AI와 시뮬레이션을 연구해온 베테랑들이 의기투합해 설립한 이 기업은 스스로를 ‘데이터 종합병원’이라 정의한다. 단순히 데이터를 모으는 것을 넘어, ISO 국제 표준에 근거해 데이터를 진단하고 합성 데이터로 부족한 부분을 채우며 중복된 데이터를 걷어내는 ‘데이터 다이어트’까지 수행한다. 최근 현대자동차 울산공장의 도장 공정 최적화를 통해 기술력을 입증하며 글로벌 시장으로의 확장을 준비 중인 이주행 페블러스 대표를 만나 AI 데이터의 미래를 물었다.

Q. 기업명에 담긴 의미와 핵심 사업 모델이 궁금하다

페블러스는 ‘멋진 조약돌(Fabulous Pebble)’의 합성어다. 흔히 데이터를 모래알에 비유하곤 하는데, 모래알은 너무 작고 많아 손으로 잡으려 해도 빠져나간다. 우리는 이 모래알 같은 데이터를 가공해 고객이 손에 꽉 쥘 수 있는 가치 있는 ‘조약돌’로 만들어 주겠다는 의지를 담았다.

우리의 주력 사업은 AI 학습용 데이터의 품질을 진단하고 개선하는 플랫폼이다. 데이터의 결손, 편향, 중복 등 품질 문제를 자동으로 진단하는 ‘데이터클리닉(DataClinic)’ 솔루션과 이를 고도화한 자율형 데이터 관리 시스템 ‘AADS(Agentic AI Data Scientist)’를 운영하고 있다. 데이터의 영상의학과 (시각화), 내과(진단), 외과( 합성데이터 및 다이어트) 역할을 모두 수행하는 종합 시스템 기업이라고 보면 된다.

데이터 클리닉 이미지 <제공: 페블러스>
Q. 데이터 품질이 왜 중요한가. 기존의 빅데이터 개념과는 무엇이 다른가?

과거에는 ‘데이터가 많을수록 좋다’는 양적 팽창에 집중했다면, 지금은 ‘AI가 바로 학습할 수 있는가’를 따지는 ‘AI-Ready Data(인공지능 준비 데이터)’가 핵심이다. 데이터가 너무 많아도 중복이 심하면 AI 성능이 오히려 떨어진다. 실제로 산불 감시 데이터의 경우 80%를 걷어내도 성능에 지장이 없는 경우가 허다하다.

우리는 데이터를 단순히 고철처럼 무게로 달아 파는 게 아니라, ‘표적 항암제’처럼 정확한 지점에 필요한 데이터를 처방한다. 부족한 곳은 물리 법칙을 따르는 ‘하이퍼 합성 데이터(Hyper-Synthetic Data)’로 채우고, 불필요한 곳은 ‘데이터 다이어트’로 깎아낸다. 데이터 품질 관련 국제 표준인 ISO 5259를 기반으로 50여 가지 품질 지표를 체크하기 때문에 글로벌 규제 대응에도 강력한 경쟁력을 가지고 있다.

Q. 해외 경쟁사들과의 차별되는 기술적 해자(Moat)는 무엇인가

우리는 진단과 개선을 한 번에 수행하는 ‘원스톱 솔루션’을 보유하고 있다. 미국의 아노말로(Anomalo)나 쉘프아이오(Shelf.io) 같은 유니콘 기업들이 있지만, 진단에만 특화되어 있거나 합성 데이터만 만드는 경우가 많다. 페블러스는 데이터 렌즈 기술을 통해 고차원의 데이터를 3차원으로 시각화(페블로스코프)하고, 이를 바탕으로 정밀하게 타겟팅된 개선안을 내놓는다.

특히 ‘뉴로-심볼릭(Neuro-Symbolic)’ 기반의 AI 에이전트 기술이 핵심 기술이다. 단순한 통계 분석을 넘어 법적 규제나 산업적 맥락을 이해하고 문제의 원인을 자세하게 설명할 수 있다. 이는 유럽 AI 법(EU AI Act) 등이 요구하는 ‘설명 가능한 AI’의 핵심 요건인 디지털 발자국(Audit Trail)을 자동 생성할 수 있다는 뜻이기도 하다.

강화 학습과 데이터 클리닉 기술을 적용해 AI 솔루션을 개발하는 페블러스 <이미지 제공: 페블러스>
Q. 딥테크 밸류업 프로그램을 통해 거둔 구체적인 성과는 무엇이며, 어떤 부분이 도움이 되었나

현대차 울산공장의 도장(Paint) 공정 최적화 프로젝트를 수행했다. 자동차가 도장 라인을 지나갈 때 로봇이 페인트를 칠하는 과정에서 비효율적 상황이 발생한다. 우리는 강화 학습과 데이터 클리닉 기술을 적용해 효율성을 높일 수 있는 AI 솔루션을 개발했다.

도장 라인의 비효율성을 줄이고 생산 비용의 절감을 기대할 수 있는 기술이다. 딥테크 밸류업 프로그램을 통해 실제 거대한 제조 현장의 데이터를 다루며 우리 기술을 실제 생산 공정에 적용할 수 있는 기회를 얻었다. 향후 생산 라인에서 본 AI 솔루션의 성과를 확인하면서 현대차의 다른 공장 및 공정으로의 확장을 논의할 수 있을 것으로 판단되며, 딥테크 밸류업 프로그램의 우수 기업으로 추천 받는 등 신뢰 관계를 구축했다.

사실 지방(대전/세종) 기반의 테크 스타트업들은 대기업의 네트워크와 연결되는 것이 쉽지 않다. 딥테크 밸류업은 현대차와 같은 대기업과의 커넥션을 직접적으로 주선해 주었을 뿐만 아니라, 딥테크 밸류업 프로그램을 통해 실질적인 비즈니스 레퍼런스를 쌓을 기회를 제공해 주었다. 단순한 자금 지원을 넘어 기업의 성장에 필요한 ‘무대’를 마련해준 점이 가장 든든했다.

Q. 현대자동차 외 다른 대기업과의 PoC(기술 실증) 사례 중 기억에 남는 것은

LG전자와 수행한 고객 데이터 시각화 프로젝트가 기억에 남는다. 8,000만 명에 달하는 고객 데이터의 패턴을 전문 시각화 도구인 ‘페블로스코프’로 연동해 임원진으로부터 호평을 받았다. 또한 해병대 수요로 진행된 합성 데이터 구축 사업에서는 ‘비주얼 튜링 테스트’를 만점에 가까운 점수로 통과했다. 전문가들도 실제 영상과 합성 영상을 구분하지 못할 정도로 물리적 정확성을 확보했다는 의미다.

Q. 향후 사업 확장 로드맵과 글로벌 진출 계획은 어떻게 되나

단순히 품질 결함을 고치는 단계를 넘어, 이제는 데이터가 스스로 성장하고 최적화되는 자율 운영 체계인 ‘데이터 그린하우스(Data Greenhouse)’에 집중하고 있다. 그 핵심 동력은 디지털 트윈 기반의 합성 데이터 생성 엔진인 ‘페블로심(PebbloSim)’이다. 물리 법칙을 완벽히 준수하여 현실 세계와 괴리가 없는, 즉 ‘물리적 할루시네이션(Physical Hallucination)’이 제거된 초고품질 멀티모달 데이터를 생산하는 것이다. 이를 통해 제조, 로봇, 국방 등 대한민국 주력 산업의 피지컬 AI 구현에 필수적인 고신뢰성 데이터를 공급하고 산업 초격차 달성에 기여하고자 한다.

Q. 앞으로의 각오

AI 시대의 진짜 경쟁력은 모델이 아니라 데이터에서 나온다고 생각한다. 페블러스는 AI를 위한 데이터가 아닌 데이터 중심의 AI(Data-centric AI)를 지향한다. 인체 검진을 정기적으로 받듯이 기업의 데이터도 정기적인 클리닉을 통해 신선도를 유지해야 한다. 한국 제조업의 초격차를 AI 데이터 기술로 뒷받침하는 국가대표 데이터 기업으로 거듭나겠다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지