1200대 전산정비 '풀가동'..생명연구자원 122만여 정보 출격 대기

이준기 2021. 1. 4. 20:04
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

한국생명공학연구원 국가생명연구자원정보센터(KOBIC) 내 구축된 바이오 데이터 센터. 국가 차원에서 바이오 데이터를 안전하고 효율적으로 관리, 제공하기 위해 마련됐다. 생명연 제공

"친환경·가상화 기술로 무장한 바이오 분야 국내 최대 규모의 데이터 센터라 해도 손색이 없습니다."

지난달 30일 대전 유성구에 위치한 한국생명공학연구원 내 국가생명연구자원정보센터(KOBIC) 1층 전산서버실. 검은색의 철제 캐비넷처럼 생긴 2m 높이의 길다란 서버가 나란히 정렬돼 있었다.

1200대에 달하는 전산 장비가 쉼없이 움직이며 사람의 대화를 끊었다. 바로 우리 한국의 모든 바이오 데이터가 축적되는 시설이다. 한 마디로 우리 'K-바이오' 산업의 미래가 달린 곳인 셈이다. 서버 위로는 노란색의 전기 케이블이 이어져 있었고, 그 밑에는 네트워크 케이블이 서버 등 각종 하드웨어와 연결돼 작동되고 있었다.

◇가상화 기반 첨단 바이오 데이터센터의 '심장'= 전산서버실에는 온통 서버 랙(Rack)을 비롯해 네트워크 랙, 백업 시스템 등 1200대에 달하는 전산장비가 쉴새 없이 돌아가는 소리에 옆 사람과 대화가 쉽지 않을 정도였다. 이 곳은 바이오 빅데이터를 안정적으로 저장·유통하는 핵심 인프라 시설이자, 바로 KOBIC의 '심장'과 같은 곳이다. 바깥 날씨는 영하를 기록하는 추운 날씨였지만, 이 곳은 전산장비의 원활한 작동을 위해 외기순환 방식의 친환경 항온항습기가 구축돼 있어 쾌적하면서 살짝 온기마저 느껴졌다. 지하에는 배터리, UPS, 발전기 등 이중화된 전원을 갖추고 있어 비상사태 발생 시에도 365일 안정적인 전원 공급이 이뤄진다.

특히 컴퓨팅, 네트워킹, 스토리지, 보안 등 모든 요소가 가상화 기술로 연결돼 있다. 이 때문에 유연하고 확장성 있는 업무 수행이 가능하고, 하드웨어 간소화로 인한 비용 절감 및 운영 효율성을 높일 수 있다. 뿐만 아니라, 가상화와 서버, 스토리지, 네트워크 등을 소프트웨어 기반으로 제공하는 '하이퍼 컨버지드 인프라 스트럭처(HCI)'가 더해져 한결 스마트한 데이터 센터로 운영되고 있다.

◇바이오 데이터 등 '국가 생명연구자원의 보고(寶庫)'= 지난해 11월 새로운 인프라 시설을 확충해 문을 연 KOBIC 바이오 데이터 센터는 명실상부 국내 바이오 최대 규모를 자랑한다. 바이오 데이터 센터를 포함한 KOBIC 건물은 2015년부터 5년 동안 총 187억원을 투입해 부지 면적 10만978㎡, 연면적 6208㎡에 지하 1층, 지상 3층 규모로 구축됐다.

바이오 데이터 센터의 전산 인프라는 1200대 전산장비(2984코어)에 최대 17.9PB(페타바이트)까지 저장할 수 있다. 현재 7만8000여 종, 1561만 여건의 생명연구자원(12.9PB)을 확보하고 있으며, 이 가운데 바이오 데이터는 122만 여건, 189TB(테라바이트)에 달한다.

센터의 CPU와 저장소는 폭발적으로 늘어나는 바이오 데이터 등 생명연구자원 수요에 대비해 최대 3만코어, 200PB까지 증설이 가능하다는 게 센터 측의 설명이다. 이천무 KOBIC 책임기술원(부장)은 "매년 서버 증설을 통해 저장 규모를 점차 늘려 바이오 데이터 뿐만 아니라, 생물소재, 유전체 등 생명연구자원 정보 확보와 분석 서비스를 확대해 바이오 데이터 연구 및 바이오 산업 발전을 기여하도록 하겠다"고 설명했다.

바이오 데이터 센터는 재해나 장애시에도 분석 서비스와 데이터를 안정적으로 보호하기 위해 생명연 오창분원에 백업된 데이터를 위한 별도의 재해복구센터와 재해복구시스템을 구축, 운영하고 있다. 특히 대용량 유전체 분석을 위한 전산 인프라와 분석 기술을 보유하지 못한 생명정보 관련 연구자에 '유전체 분석용 클라우드 서비스(바이오-익스프레스)'를 무료로 지원하고 있다.

생명연은 바이오 데이터 및 분석지원 시스템 등을 활용해 서울대와 함께 한국인들이 가지고 있는 유전체와 서양인 유전체의 다른 특성을 규명해 냈으며, 폐암의 유전적 원인도 밝혀내는 성과를 거뒀다. 최근에는 코로나19 바이러스의 염기서열 정보를 토대로 변이 여부를 분석하는 연구도 진행하고 있다.

센터는 연구자, 산업계에 대용량 바이오 데이터 분석 시스템을 개방 운영하고 있다. 또한 국가생명연구자원의 통합정보시스템(KOBIS) 및 범부처 생명연구자원 정보 연계를 통한 생명연구자원 및 유전체 정보 활용체계 구축, 전산 연구자원 인프라를 지원하고 있다.

김장성 한국생명공학연구원장은 "바이오 데이터 센터가 국가 생명연구자원 정보 분석에 필요한 특화된 시스템을 기반으로 국민, 연구자, 산업계에 질 높은 분석 서비스를 제공함으로써, 국가 바이오 데이터 스테이션 사업의 성공적인 추진과 생명연구자원 및 유전체 정보 활용 활성화 등에 기여하겠다"고 말했다.

이준기기자 bongchu@dt.co.kr

Copyright © 디지털타임스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?