“국내 모든 논문·보고서 디지털 공유… 오픈 사이언스 생태계 구축”

노성열 2023. 1. 18. 09:03
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

■ 한국과학기술정보연구원 김재수 원장 인터뷰
‘슈퍼컴 지원기관’이미지 벗고
데이터 활용 모든 해결책 제시
기업들과 함께 산업화도 마련
경제발전 돕는 기관 거듭날 것
현재 ‘청각 AI’개발에도 심혈
공장·열차 등서 소리 수집해
위험 감지하는 ‘산업 청진기’
TF 뛰어넘는 ‘애자일 경영’에
민첩·유연한 퍼스트 무버 추구
김재수 한국과학기술정보연구원(KISTI) 원장이 지난 5일 서울 분원에서 KISTI의 캐릭터인 ‘키온(KION)’을 손가락으로 가리키고 있다. 키온은 영문 기관명 ‘키스티’와 주요 인프라인 ‘누리온’(슈퍼컴퓨터) 및 ‘사이언스온’(과학기술 지식 아카이브)의 머리글자를 조합한 이름이다. 문호남 기자

“혹시 ‘청각 지능’이란 말 들어보셨나요? 지금까지 인공지능(AI)이 주로 사람의 시각보다 우수한 성능으로 이미지를 신속·정확하게 처리하는 실력으로 우리를 깜짝 놀라게 해왔습니다. 일종의 ‘기계 눈’이라 할 수 있지요. 그런데 원래 인간의 감각은 보는 것뿐 아니라 듣고 냄새를 맡고 맛보고 만지는 오감(五感)의 종합적인 멀티모달(multi―modal·다차원) 시스템입니다. 그래서 우선 음성 데이터로 AI 학습을 시키는 연구를 하고 있습니다. 만약 청각 AI가 완성된다면 사람의 가청 주파수를 넘어 쥐나 박쥐만 들을 수 있는 초음파를 포함해 모든 소리를 기계가 인식할 수 있게 되지요.”

김재수 한국과학기술정보연구원(KISTI) 원장이 지난 5일 서울 분원에서 인터뷰를 시작하면서 이렇게 청각 지능 이야기를 꺼냈을 때 기자는 살짝 놀랐다. KISTI는 속칭 ‘슈퍼컴퓨터’로 불리는 초고성능컴퓨팅 지원 기관이라고만 막연하게 생각하고 있었기 때문이다. 그러니까 국방과학연구소(ADD), 한국항공우주연구원(KARI) 같은 국가 연구기관들이 연구·개발(R&D)을 할 때 막대한 컴퓨터 계산력이 필요한 빅데이터를 분석하는 과정에서 KISTI의 힘을 빌린다고만 알고 있었던 것이다. 김 원장의 놀라운 설명은 계속 이어졌다.

“사람이 못 듣는 소리까지 듣는 똑똑한 ‘기계 귀’인 셈입니다. 지금 이 방에도 기자님이 치는 노트북 키보드 소리와 난방기 팬 돌아가는 소리 같은 게 섞여 있습니다. 청각 AI는 전체가 섞인 소리 속에서도 사람이 몇 명 있는지, 무슨 이야기를 하고 있는지 등을 파악하고, 심지어 소리를 내는 음원별로 별도의 분석도 가능합니다.”

산업·국방 분야에서의 활용 가능성은 더 무궁무진했다. 김 원장은 “이 기술을 응용하면 화학 공장이나 핵발전소 같은 안전관리 시설에서 나는 소리만 수집해도 위험을 사전에 감지하거나 특이사항이 있는지 진단하는 일종의 ‘산업적 청진기’로 쓸 수 있다”고 전했다.

“실제로 우리 연구소가 현재 울산에서 철도기술연구원과 공동으로 철도가 운행될 때 나는 부품 소리만 듣고도 이상 유무를 감지하는 청각 AI를 테스트하고 있습니다. 좀 더 상상을 넓히면 군사분계선 지역에 CCTV를 달아놔도 그 많은 화상 데이터를 다 볼 인력이 없잖아요. 음향 센서를 쫙 뿌리고 AI 학습을 시키면 그냥 멧돼지 소리인지, 사람 소리인지 다 알 수 있을 겁니다. 국방부에 가서 이 얘기를 했더니 깜짝 놀라더군요.”

KISTI는 현재 보유 중인 슈퍼컴퓨터 5호기 ‘누리온’보다 20배로 더 빠른 600페타플롭스(PetaFlops) 성능의 6호기가 지난해 말 약 3000억 원 규모의 예비타당성 조사를 통과해 조만간 글로벌 10위권 내 슈퍼컴퓨팅 파워를 갖게 된다.

플롭스는 부동소수점의 연산횟수를 가리키는 컴퓨터 용어고, 페타는 10의 15제곱(1015)을 뜻하는 단위로서 1페타플롭스는 1초에 1000조 번의 연산처리를 할 수 있는 속도를 말한다. 김 원장은 “엑사(Exa)급으로 바꿨으면 세계 7∼8위로 뛰어올라 5대 컴퓨팅 강국이 됐을 텐데 아쉽다”며 과학자다운 욕심을 살짝 내비쳤다. 엑사는 10의 18제곱(1018)으로 100경(京)에 해당한다.

흔히 데이터를 ‘21세기의 원유’라고 말한다. 모든 정보와 지식이 디지털 기록으로 변환되면서 막대한 데이터가 하루하루 산더미처럼 쏟아지고 있다. 하지만 데이터를 종류별로 모아 서로 통하게 하고 그 속에서 의미 있는 분석결과를 채굴하는 작업, 데이터 마이닝(data mining)은 결코 만만한 작업이 아니다. AI의 힘을 빌려 인간이 쓰기 쉽고 편리하게 가공하면서 동시에 물 흐르듯 막힘이 없도록 구조를 설계한 후 이를 노련하게 운영하는 노하우가 쌓여야 한다.

KISTI는 윤석열 대통령의 공약 사항인 ‘디지털플랫폼 정부’ 시대를 맞아 실제 슈퍼컴퓨터 지원기관이라는 단일 이미지에서 벗어나 우리나라 국가 과학기술정보 분야의 대표 기관, 데이터 과학의 최고 기관으로 급부상하고 있다. 김 원장은 올해 신년사에서 “데이터를 이용해 모든 해결책을 제시할 수 있는 ‘데이터 종합 연구기관’으로 거듭나고 있다”고 표현했다.

그래서 KISTI는 오픈사이언스(Open Science·정보공유) 기반의 열린 데이터 생태계를 구축하고 국가 경제산업 발전으로 이어지도록 임무를 재정의했다. 예를 들어 AI 생태계 플랫폼 ‘AIDA(AI Data Archive)’를 구축하기 위해 과학기술 분야의 기계학습과 멀티모달 데이터셋과 AI 인터페이스를 제공할 뿐 아니라, AI 모델링까지 민간과 손잡고 비즈니스 산업화하는 방안을 짜고 있다.

김 원장은 “미국의 문제해결형 플랫폼 ‘케글’처럼 1년 365일 난제 풀이 경진대회를 해서 집단지성을 이끌어낼 수 있다”며 “우리 실정에 맞는 ‘한국판 케글’을 만들고 싶다”고 희망을 소개했다. KISTI는 실제로 특정 분야에 치우침 없이 국내 과학기술계의 모든 연구자와 기관을 고객으로 갖고 있어 폭넓은 생태계를 조성할 잠재력이 풍부하다. 그래서 우리나라에서 생산된 논문과 연구 보고서를 디지털로 자유롭게 공유할 수 있도록 국가 연구 데이터 클라우드센터를 만들려 한다.

김재수 KISTI 원장이 지난해 기관 설립 60주년을 맞은 연구원의 미래비전에 대해 설명하고 있다. 문호남 기자

―KISTI는 지난해 5월 기관 설립 60주년을 맞았다. 사람으로 치면 환갑인데, 제2의 인생을 위해 어떤 재탄생을 준비하나요.

“지난 60년은 우리에게 큰 의미가 있던 세월이었습니다. 국가적으로도, 경제 산업적으로도 그렇습니다. 1962년 1인당 국민총생산(GNP)이 100달러도 안 되는 나라에서 과학기술정보센터를 만들고 기술혁신 임무들을 수행해왔어요. 울산 공단과 해외 코트라의 3각 편대 진용을 갖추고 경제산업 발전에 이바지해왔다는 자부심이 있습니다. 지금의 대한민국은 과학자들에게 사회문제 해결에서 행복추구까지 더 넓은 임무를 할 수 있는지 묻고 있습니다. 재난관리, 국방 같은 국민 생명과 안전에 직결되는 대형 문제뿐 아니라 호우 침수 등 도시문제, 노인복지, 심지어 요인 경호까지 과학이 일상생활 속으로 들어왔죠. 개인적으로는 올 3월에 3년 차 임기를 시작합니다. KISTI의 미래 비전은 구성원들이 동의해줘 차근차근 하나씩 성과를 내고 있습니다. 물론 계속 앞으로 갈 수만은 없지요. 전력질주보다는 좌우, 앞뒤까지 행간을 보면서 세심하게 가려 합니다. ‘배진(倍進)’이란 용어로 독려하고 있어요. 데이터 시대를 맞아 이제 물 들어왔을 때 노 젓는 정도의 수준이 아니라 2배의 힘을 내서 총력으로 좁은 연안 바다를 떠나 대양으로 나아가자고 외칩니다.”

―내부적으로 ‘애자일(Agile) 경영’을 외쳐 큰 성과를 본 것으로 알고 있는데 무슨 개념인지 설명해주세요.

“애자일은 원래 소프트웨어 개발방식에서 나온 말입니다. 사전적으로는 첫째, 개인과 개인 간의 상호작용을 사전에 정해진 절차나 방식(tool)보다 우선시하고 둘째, 제대로 돌아가는 소프트웨어를 딱딱한 문서보다 중요시하며 셋째, 고객과의 협업을 계약서보다 더 먼저 생각하고, 넷째, 돌발 변수에 유연하게 대응하는 것을 그냥 계획대로 밀고 가는 것보다 귀하게 여긴다고 정의합니다. 민첩하고 유연하게 움직이지 않으면 퍼스트 무버(first mover)가 될 수 없어요. 퍼스트 무버는 무엇을 연구할지 스스로 목표를 찾아야 합니다. 그 목표도 무빙 타깃입니다. 처음 계획을 세운 대로, 프로세스대로 그냥 해서는 맞출 수 없습니다. 미사일처럼 날아가는 중간에 목표를 추적해 계속 진로를 바꿔야 하는데, 그렇지 못하고 직진만 하면 실패합니다. 그래서 연구소에 기존 편제에 없는 유연한 셀(cell·소규모 연구단위) 조직을 도입했죠. 단 이틀 만에 만든 애자일 조직도 있어요. 해보고 미션이 수행되지 않으면 그냥 종료합니다. 긍정적 실패는 허용합니다. 현재 9개 애자일 조직을 운영 중이에요. 이 가운데 잘해서 정규 팀으로 진화한 곳도 있습니다. 우리 연구원들이 400명, 행정·기획까지 한 500명 되니까 10%는 애자일을 이미 경험해 봤어요. 그래도 아직 구성원들이 과거 태스크포스(TF) 제도와 헷갈려 하는데, 좀 다른 개념입니다. 애자일은 겸직을 허용하고, 인사고과도 정규 조직과 합산 평가합니다. 처음 해본 시도라서 큰 계획을 세우고 중장기 플랜대로 밀고 가면서 앞으로 미세 보완을 할 것입니다. 물론 모든 조직을 애자일하게 운영할 순 없습니다. 안정적인 요소도 중요합니다. KISTI가 30년 이상 공공 데이터 서버를 운영하면서 지난번 카카오 화재 같은 서비스 중단 사고가 단 한 번도 없었어요. 벤처처럼 소규모로 자유롭게 맘대로 놀아봐라 하는 게 애자일 조직이고, 안정적인 조직은 태산처럼 든든해야 합니다.”

△1961년 9월생 △홍익대 전자계산학 학사, 한국외국어대 석사, 홍익대 전자전산공학 박사 △2012∼2015년 데이터거버넌스 포럼 회장 △2012∼한국기술혁신학회 회장(2021년), 데이터위원회 위원장 △과학기술연합대학원대 전임교수 △한국과학기술정보연구원 원장 △과학기술출연기관장협의회 회장

과학기술 R&D 전과정 ‘사이언스 온’ 서비스… 산·학·연 지식교류 주도 ■ KISTI는 어떤 조직 ?

우리나라 과학기술 데이터 생태계의 중심에 한국과학기술정보연구원(KISTI)이 있다. 일반인에게는 슈퍼컴퓨터 운영기관으로 널리 알려져 있지만 과학계 내부에서, 그리고 산업계와 연결되는 외부 협력 생태계에서 단연 데이터 종합 연구기관으로 우뚝 서 있는 존재다.

과학기술인들이 연구를 시작하고 진행해서 성과를 낼 때까지 연구·개발(R&D)의 전(全)주기에 걸쳐 수시로 사전처럼 찾아보는 과학기술 지식 인프라 ‘사이언스온(ScienceOn)’을 서비스하고 있다. 국가 연구 데이터 플랫폼 ‘데이터온(DataOn)’ ‘국가과학기술지식정보서비스(NTIS)’도 같은 맥락에서 운영 중인 데이터 백과사전들이다. 과학·기술·산업 분야에서 발생하는 이종(異種) 데이터들을 융합 분석할 수 있는 지능형 검색·분석 모델을 개발하는 게 최종 목표다. KISTI는 국가전략산업을 육성하는 데 필요한 공공 R&D 연구성과와 기술 사업화의 데이터를 통합하고, 인공지능(AI) 학습으로 경제적 가치를 창출할 수 있도록 플랫폼을 만들 방침이다. 전국 중소·중견 기업들의 기술 사업화를 돕는 과학기술정보협의회(ASTI)는 1만4000여 회원을 둔 국내 최대의 산·학·연·정 지식교류협의회다.

디지털플랫폼 정부 시대를 맞아 KISTI는 과학기술 정보 데이터를 단순 구축하고 DB를 관리하는 데서 한 걸음 더 나아가 데이터에 뿌리를 둔 지능형 분석 플랫폼을 고도화하기 위해 애쓰고 있다. 이를 통해 막대한 예산이 투여된 국가 R&D 성과가 재난 관리, 국방, 도시문제 해결 등 우리 실생활의 난제를 푸는 데 실질적인 도움이 되도록 사다리를 놓는다는 계획이다. 또 민간과 협력해 과학기술이 비즈니스로 연결돼 국가전략산업을 육성할 수 있도록 기업들을 돕는 산·학·연 생태계의 중심에서 활약한다는 목표를 세워놓고 있다.

노성열 기자 nosr@munhwa.com

Copyright © 문화일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?