"AI도시 실현 위해 ‘데이터 파이프라인’ 구축돼야"
‘광주 실리콘밸리’ 청사진 실질적 방안 제시
AI스타트업 場 조성으로 수집 범위 넓혀야
‘데이터센터’통해 다수 GPU·인프라 융합

'대한민국의 실리콘밸리'를 꿈꾸는 광주광역시의 청사진을 실현하기 위한 실질적인 방안이 제시됐다.
지난 6월 25일 이재명 대통령의 두 번째 대국민 소통 행사 '광주시민·전남도민 타운홀 미팅'에 전광명(39) 인트플로우㈜ 대표가 지역 AI인프라 구축 사업을 위한 대안으로 '데이터 파이프라인' 구축을 제시하면서다.
앞서 전광명 대표는 AI를 기반으로 돼지 몸무게를 시각 정보로 측정할 수 있는 '비접촉 양돈 자동화 솔루션'을 개발해 지난해 미국 라스베이거스에서 열린 국제전자제품박람회(CES 2024)에서 '혁신상'을 수상한 바 있다.
이에 전광명 대표를 만나 광주시의 미래 산업 확보를 위한 실질적인 방안을 들어봤다.
다음은 전광명 대표와의 일문일답.
-타운홀 미팅에서 제안한 '데이터 파이프라인'이란 무엇인가.
▶산업 현장의 문제를 AI로 해결하려면 그 문제와 관련된 데이터가 있어야 AI를 학습시키고 서비스로 발전시킬 수 있다. 그런데 산업 현장의 데이터들은 대부분 현장 내부에 고립돼 있거나 아예 수집이 안되고 사라지는 경우가 대부분이다.
제가 생각하는 데이터 파이프라인이란, 이렇게 AI를 적용해야 하는 산업 현장에서 데이터를 매일 모으기 위한 '인프라'라고 보면 되겠다. 산업 현장이 데이터가 처음 생성되는 '저수지'에 비유한다면, 데이터 파이프라인은 AI 개발기관들이 데이터를 활용할 수 있도록 끌어오는 '수도관' 같은 역할이죠.
그런데 이러한 현장 데이터들은 가공되지 않은 '원시 데이터' 이기 때문에 품질의 문제고 있을 것이고, 개인정보가 포함 돼 있는 등 법의 제약을 받을 수 있는 내용이 포함돼 있을 수도 있다. 이런 문제를 해결하기 위해서는 다수의 GPU와 인프라를 갖추고 공신력을 갖춘 광주시 데이터센터가 그 데이터를 '전처리' 해 정제되고 안전한 '클린 데이터'를 만드는 역할을 해야 한다.

-'데이터 파이프라인'을 구축하기 위한 요건은.
▶지원사업 예산 획득을 위한 수요가 아닌 진짜 현장의 'AI 수요' 파악이 우선 돼야 한다. 각 산업현장별로 AI를 도입해 해결하고자 하는 문제 정의를 우선시 하는 것이다.
한 유리공장의 사례를 들어보자면, 그곳에서 유리 겉면의 결함을 찾기 위해 작업자들이 3교대로 24시간 육안 검사를 하고 있거든요. 이런 곳에 적절한 데이터 수집 장치와 데이터 전송 장치를 검사자의 위치에 같이 설치할 수 있다면, 향후 이러한 검사 과정을 효율화/자동화 할 수 있는 AI 서비스를 개발하기 위한 핵심 데이터가 매일매일 수집될 수 있게 되죠.
문제 정의가 된다면 각 문제별로 AI가 해결 가능한 문제인지를 전문 기관에서 검토 후, '데이터 파이프라인' 구축을 지원해줘야 한다. 데이터 파이프라인의 종착역은 AI 개발업체가 아닌 데이터 처리 중간 지점인 '데이터센터'가 돼야 한다.
현장에서 모인 데이터는 가공이 되어있지 않고 개인정보가 포함되었을 수도 있기 때문에, 데이터센터에 집중 후 그 곳의 많은 GPU 자원과 고사양 AI 모델을 활용해 '자동 전처리' 과정을 거쳐 데이터를 정제 해야 한다.
이렇게 정제된 데이터를 AI기업들에 제공해 산업 현장별 문제를 해결하는 솔루션을 개발하게 하고, 사업화 성공시 이익을 나누는 것이 바람직 하다 본다.
이때 배제 돼선 안되는 곳이 본 산업현장이다. 산업현장이 원시 데이터를 기꺼이 제공하는 과정 자체가 시간과 인력, 노력이 들어가기 때문에 데이터 파이프라인의 구축과정 전과정, 또 사업화 성공 이후에 직/간접적인 혜택이 돌아가야만 산업 현장들이 적극적으로 AI 도입에 참여할 것이다.
-'데이터 파이프라인' 구축이 실현가능한 사업인지, 또한 이를 실현하기 위해 광주시가 준비해야할 요건은.
▶과정별 이해관계와 이에 따른 보상의 형태, 크기 등을 정교하게 설계 한다면 데이터 파이프라인 구축은 실현가능성이 높은 사업이라고 생각한다.
AI 산업의 부흥을 위해서 역설적이게도 AI와 가장 멀리 떨어져 있는 현재 산업현장의 실제 수요를 폭넓게 파악하는 것이 최우선이다. (광주시에 요청)
이 수요들 중 AI도입 시 기대효과가 큰 문제부터 데이터 파이프라인을 구축해 정제되고 법적 문제가 없는 '깨끗한' 데이터들이 광주시 소재 기업, 기관들에게 제공된다면 지역 내 AI 기업들이 전세계를 선도할 수 있는 혁신적인 AI 서비스를 만들어 내는 것도 가능하다 본다.
이때 데이터센터가 데이터를 제공하는데 허들을 두었으면 한다. 예를 들어 광주시 데이터를 활용해 서비스를 만든다면 최소 고용 인원과 고용 유지 기간을 요구하는 식으로 말이죠. 고품질의 현장 데이터를 경쟁력 있는 아이템 삼아, 외부 기업들이 광주 내에 입주 하고, 또 인력들을 고용·유지해 AI 생태계가 살아나는 불씨가 되기를 바란다.
여러 분야가 있겠지만, 우선 헬스케어 분야의 데이터 파이프라인 구축이 가장 시급하다고 조언 드린다.
광주시 내 종합병원 23개, 일반병원 2천177개에 쌓여있는 헬스데이터의 양과 가치는 무궁무진하다. 여기서 실제로 의료 기관이 해결했으면 하는 문제와 그와 관련된 데이터, AI 기술을 구체적으로 파악한 다음, '데이터 파이프라인'을 통해 정제된 데이터를 광주시 내 AI 기업에게 공개한다면, 각 기업들이 가진 아이디어와 기술력만으로 크고 작은 다양한 AI 서비스를 개발할 수 있을 것이다. 실제 데이터로부터 만든 서비스이기 때문에 품질과 성능도 뛰어날 것 이구요.
/정희윤 기자 star@namdonews.com