NIA 데이터통합혁신센터 문열었다 …'디지털플랫폼 정부' 탄력 [데이터가 국부(國富)다]

이재철 기자(humming@mk.co.kr) 2023. 4. 24. 16:27
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

매일경제·한국지능정보사회진흥원 공동기획
지난 20일 한국지능정보사회진흥원(NIA) 대구 본원에서 열린 '데이터통합혁신센터' 개소식에서 황종성 NIA 원장(왼쪽 다섯째)과 홍준표 대구광역시장(넷째), 고진 디지털플랫폼정부위원회 위원장(셋째) 등이 기념촬영을 하고 있다. 대구시청

작년 말 혜성처럼 등장한 생성형 인공지능(AI) '챗GPT'는 AI 기술 및 서비스 개발 기업들을 단숨에 긴장시켰다.

마치 사람과 대화하는 듯한 문장 구사력과 기능은 출시 두 달 만에 1억명 이상의 이용자를 확보하고, 손에 잡힐 듯 잡히지 않던 AI 기술의 효용성을 전 세계에 각인시켰다. 이는 비단 기업은 물론 산업 주도권 확보를 위한 정부의 발걸음에도 가속력을 불어넣고 있다.

지난 14일 윤석열 대통령은 디지털플랫폼 정부 실현 계획 보고회에서 디지털플랫폼 정부는 "과거의 전자정부에서 조금 업그레이드된 것이 아니라 차원이 완전히 다른 것"이라고 하면서 그 근간에는 AI 기술이 있음을 강조했다.

이는 AI를 기반으로 각 부처와 여러 기관에 흩어져 있는 정보를 하나의 플랫폼에 통합해 국민과 정부에서 활용할 수 있도록 한다는 구상이다. 이를 통해 국민에게 제공하는 행정서비스를 최적의 맞춤형으로 선제 제공한다는 목표다.

같은 날 발표된 정부의 '초거대AI 경쟁력 강화 방안'에서도 초거대AI는 사람 수준의 언어 및 시각 능력을 토대로 디지털 산업 자체의 파괴적 혁신과 경제·사회 전 분야의 AI 내재화를 주도할 것으로 전망됐다. 실제 기업들은 그간 데이터 축적과 AI 기술력 향상 등 인공지능 기반 조성에 집중한 노력으로 독자적인 초거대AI 플랫폼을 확보하고 세계를 향해 도전을 시작하고 있다. 이에 발맞춰 정부도 글로벌 초거대AI 시장을 선도해나갈 수 있도록 초거대AI 대응 관점에서 새로운 AI 정책 방향을 제시하고 있는 것이다.

정부는 초거대AI 경쟁력 강화를 위해 산업계 수요를 기반으로 해외 시장 공략을 위한 대규모 언어 학습용 데이터 200종(책 15만권 분량)을 구축하는 등 관련 기술 및 산업 핵심 인프라스트럭처를 확충할 계획이다.

또한 변호사, 의사 등 전문가의 업무를 보조하는 '초거대AI 플래그십 프로젝트'를 통해 AI 혁신 생태계를 조성하고 초거대AI 규제 개선과 제도 정립에 나선다. 이 과정에서 AI 혁신 제도와 문화 정책이 뿌리내릴 수 있도록 최선을 다한다는 의지다.

주목할 점은 초거대AI의 경쟁력 강화 방안 중 핵심 축인 인공지능 학습용 데이터 구축 사업에서 새 변화의 바람이 불고 있다는 사실이다.

이 사업은 AI 성능 향상의 필수 요소인 대량의 학습용 데이터를 구축해 개방하는 것으로 2017년 닻을 올렸다. 이 사업을 통해 데이터 구축에 많은 시간과 비용을 투자하기 어려운 중견·중소기업과 스타트업, 대학이 수혜를 입는 등 혁신 스타트업 성장의 촉매제 역할을 하고 있다.

민간이 필요로 하는 인공지능 학습용 데이터를 발굴하고 부족한 데이터를 구축해 개방하는 정부의 노력이 디지털경제로 전환하는 산업의 변곡점과 맞물리면서 인공지능 학습용 데이터 구축 사업은 한국어, 헬스케어, 교통 등 다양한 분야에서 총 691종의 데이터를 구축하는 등 빠르게 확장할 수 있었다. 이 중 총 381종이 민간에 개방됐으며, 지난해 구축한 310종 역시 품질검증을 거쳐 'AI허브'(aihub.or.kr)를 통해 순차적으로 개방될 예정이다. AI허브는 학생, 개발자, 산업계 등 인공지능 학습용 데이터에 관심 있는 국민 누구나 쉽게 데이터에 접할 수 있도록 지원하는 공공 인프라로 자리매김했다.

2023년 인공지능 학습용 데이터 구축 사업은 이 성과에 더해 챗GPT와 같은 초거대AI에 기반한 대화형 모델 지원을 위한 데이터 구축도 추진한다는 점에서 그 의미가 크다는 평가다.

기존 지도학습용 데이터(라벨링 데이터) 물량은 일부 축소하고, 한국어 21종 등을 포함한 총 34종의 데이터를 '초거대AI 지원 데이터'로 구분해 자기지도학습에 필요한 비라벨링 데이터 구축을 확대한다. 또 현재까지 구축된 언어 데이터 약 100억개 토큰에서 산업 분야별로 특화 언어 데이터 약 200억개 토큰을 추가로 구축해 300억개 토큰 이상 초거대AI 개발에 필요한 데이터를 빠르게 공급할 예정이다.

이외에도 이미지 유형의 데이터는 이미지 내 객체의 설명을 포함한 캡션 정보를 추가해 생성 AI 기술을 지원하는 등 총 130개 지정과제와 20개 자유과제에 대해 다음달 19일까지 공고를 진행 중이다.

인공지능 학습용 데이터 구축 사업은 이처럼 올해 시범적으로 초거대AI 지원을 위한 사업으로 재편된 뒤 내년부터 전면 개편에 들어간다.

이와 관련해 한국지능정보사회진흥원(NIA)은 지난 20일 데이터 정책 발굴에서부터 산업 활성화까지 '데이터 전주기'를 지원하는 '데이터통합혁신센터'를 NIA 대구 본원에 개소해 주목받고 있다.

기능적인 면에서 데이터통합혁신센터는 데이터 정책 수립과 데이터 활용 및 기술 지원 등 데이터의 생산·수집·유통·활용을 지원하는 '데이터통합지원센터'와 공공데이터 개방·활용·품질관리를 지원하는 '공공데이터활용지원센터'로 구성된다.

하위에는 데이터 전주기에 따른 각각의 역할을 지닌 △AI허브 안심존 △데이터결합지원센터 △데이터기반행정 전문기관 △데이터산업지원 전문기관 △데이터 아카데미 △본인정보제공 지원센터 등 6개의 기능이 유기적으로 연계된다. 이를 통해 공공과 민간을 아우르는 데이터를 개방하고 데이터 기반의 사회문제 해결과 기업의 경쟁력을 향상시킬 수 있는 서비스 개발도 지원한다.

아울러 초거대AI 기술 선도를 위한 인공지능 학습용 데이터 구축, 빅데이터 제공 등으로 우리나라의 데이터 산업 생태계 혁신과 데이터 산업의 글로벌 진출을 지원할 예정이다.

특히 AI허브 안심존은 데이터 반출 없이 AI모델 개발이 가능한 개발 환경과 AI 학습용 데이터를 제공하는 형태로 기업들의 높은 수요가 예상되고 있다.

앞서 황종성 한국지능정보사회진흥원장은 매일경제와 인터뷰에서 디지털 플랫폼 정부가 민간 영역에 미치는 영향에 대해 탁월한 연결성에 따른 파괴적 서비스의 출현을 기대했다. 그는 "정부가 플랫폼 방식으로 바뀌면 민간도 플랫폼 방식으로 전환하게 되고 이 과정에서 기업들은 경쟁력을 키우기 위해 다른 기업과의 사일로(차단)보다 상호 연결성을 추구하게 될 것"이라고 설명했다. 그는 "의료, 교통, 에너지 등 서로 다른 시장에서 정부 플랫폼이 민간 산업의 놀이터가 되고 정부와 민간이 함께 문제를 푸는 과정에서 기업 간 사일로가 해체돼 다양한 파괴적 서비스가 나올 것"이라고 기대했다.

NIA는 1987년 국가 전산망 구축을 시작으로 초고속 정보통신 기반 구축, 전자정부사업, 공공부문 데이터베이스(DB) 구축 사업, 공공데이터 개방 등을 통해 국가 정보화와 데이터 산업 발전에 기여해왔다. 그간 정부가 추진해온 공공과 민간 데이터 정책도 총괄 지원하고 있다.

NIA 관계자는 "이번에 개소한 '데이터통합혁신센터'가 국가 데이터 경제 활성화를 선도하고 글로벌 경쟁력을 제고하는 역할뿐 아니라 디지털 플랫폼 정부의 성공과 대한민국 디지털 대전환에 기여할 것"이라고 밝혔다.

[이재철 기자]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?