HDD·SSD 넘는 ‘1g당 215페타’ 잠재력…DNA 저장장치 첫선

곽노필 기자 2023. 12. 7. 09:35
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

1KB 용량…저장 수명 최소 150년
영원히 간직하고픈 데이터에 적합
1g에 영화 3600만편 저장 잠재력
바이오메모리가 세계 처음으로 출시하는 DNA 저장장치. 바이오메모리 제공

미래의 기술로만 여겨져 온 차세대 저장장치 ‘DNA 칩’이 마침내 시중에 나왔다.

프랑스의 신생기업 바이오메모리(Biomemory)는 1KB의 데이터를 저장할 수 있는 신용카드 크기의 DNA 저장장치를 출시한다고 최근 발표했다. 1KB는 한글 기준으로 약 450자(200자 원고지 2.3매)에 해당한다. 가격은 DNA카드 2개 묶음에 1천달러로 정했다.

사상 최초의 DNA 저장장치가 될 이 카드는 아직은 저장 용량이나 가격에서 기존 데이터 저장장치의 경쟁상대가 되지는 못하지만, DNA 칩의 첫발을 뗐다는 상징적 의미가 있다.

이 회사 대표 에르판 아르와니(Erfane Arwani)도 “DNA 저장장치를 세상에 내놓을 준비가 돼 있음을 보여주고 싶었다”며 이번 출시를 일종의 실험으로 평가했다.

DNA는 자연이 발명한 최고의 저장 시스템이다. 생명체의 모든 유전정보는 아데닌, 시토신, 구아닌, 티민(A, C, G, T)이라는 4개의 염기가 쌍을 이루고 있는 이중나선 형태의 DNA 분자 안에 저장돼 있다. 이를 이용한 DNA 저장장치는 저장 기간이나 밀도, 소비하는 에너지 등 여러 면에서 장점이 많다.

DNA가 저장장치의 차세대 대안으로 주목받는 것은 무엇보다 전 세계 데이터 생산량이 급속히 늘고 있어 저장 공간 부족 문제가 불거질 가능성이 높기 때문이다. 바이오메모리에 따르면 전 세계에서 생산되는 디지털 데이터는 연간 100조기가바이트(10만엑사바이트)에 이르며, 2025년에는 그 수치가 두배로 늘어날 전망이다.

우선 DNA는 데이터 저장 밀도가 매우 높다. 하버드대 비스연구소 추산에 따르면 1g의 디엔에이는 최대 215페타바이트(1페타바이트=100만기가바이트)의 정보를 담을 수 있다. 예컨대 영화의 데이터 용량이 6기가바이트라면 DNA 1그램에 영화 3600만편을 저장할 수 있다. 2025년 175제타바이트(1제타바이트=100만 페타바이트)로 예상되는 전 세계의 모든 디지털 데이터를 81kg의 DNA에 저장할 수 있다는 얘기다. 궁극의 저장매체라고 해도 과언이 아니다.

DNA는 또 유에스비나 하드디스크 드라이브 등 기존 데이터 저장장치에 비해 수명이 길다. 일반적인 저장매체의 수명이 5~10년 안팎인 데 비해, DNA 저장장치는 수백, 수천년 기록 보존이 가능하다. 이 회사가 보증하는 최소 저장 수명은 150년이다. 과학자들은 서늘하고 건조한 환경을 계속 유지해 줄 수만 있다면 보존 기간이 수십만년도 가능한 것으로 본다. 실제로 고고학계에선 수십만년 전 DNA를 검출하는 사례가 잇따르고 있다.

오늘날 데이터센터에 사용하는 SSD나 하드디스크 드라이브보다 관리하는 데 드는 에너지가 훨씬 적다는 점도 빼놓을 수 없는 장점이다. 정보가 DNA로 인코딩되면 DNA 서열분석기를 사용하여 검색할 때까지 에너지를 사용할 필요가 없다. 국제에너지기구에 따르면 지금의 데이터 센터가 쓰는 에너지는 전 세계 전력 사용량의 1~1.5%에 이른다.

데이터를 DNA에 저장하려면 먼저 0과 1로 이뤄진 디지털 코드를 염기 코드(A, C, G, T)로 변환해야 한다. 픽사베이

디지털 데이터를 어떻게 DNA에 저장할까

바이오메모리의 목표는 지금의 덩치 큰 하드 드라이브보다 훨씬 작고 에너지도 덜 쓰는 DNA 저장장치로 이뤄진 데이터센터를 개발하는 것이다. 2026년까지 100페타바이트 용량의 데이터 센터용 DNA 저장장치를 출시하는 게 당면 목표다.

데이터를 DNA에 저장하려면 먼저 0과 1로 이뤄진 디지털 코드를 염기 코드(A, C, G, T)로 변환해야 한다. 예컨대 A(아데닌)은 T(티민), C(시토신)은 G(구아닌)과 짝을 이루므로 A와 T는 0으로, G와 C는 1로 설정하는 식이다. 바이오메모리 웹사이트에서 저장하고자 하는 문자를 구글 번역과 비슷한 형태의 창에 입력하면 DNA 코드로 변환할 수 있다. 그러면 해당 코드가 지시하는 염기 서열과 일치하도록 염기 하나하나를 화학적으로 합성해 DNA 가닥을 구축한다.

그런 다음 DNA를 건조시킨다. 건조 과정이 끝나면 동그란 칩 속에 DNA를 넣은 뒤 다시 신용카드 형태의 장치에 보관한다. 카드는 DNA가 산소에 노출되지 않도록 밀봉된다.

바이오메모리 웹사이트의 DNA 번역 창에 영어로 ‘나는 한국의 한겨레신문 기자다’라는 문장(왼쪽)을 입력하자, 오른쪽에 이를 염기(A, T, G, C) 코드로 변환한 결과가 나타났다.

아직 번거롭고 비용도 많이 들지만 잠재력 막대

고객에게 주어지는 두 개의 카드 중 하나는 보관용, 다른 하나는 데이터 읽기용이다.

저장 내용을 복구하려면 카드 중 하나를 우편으로 회사에 보내면 된다. 그러면 회사가 카드를 개봉해 DNA를 다시 용액에 담근 뒤 시퀀싱 기계로 판독한다. 판독 결과를 고객에게 이메일로 전송하면, 이를 바이오메모리 웹사이트에 연결해 문자 메시지로 변환할 수 있다.

DNA 칩은 현재로선 데이터 저장과 보관, 복구 방식이 매우 번거롭고 비용이 많이 든다. 시간이 오래 걸리는 것도 문제다. 현재 1KB의 데이터를 만드는 데만도 약 8시간이 걸린다.

회사는 그러나 비밀번호, 금고 열쇠 위치 등 데이터를 장기적으로 안전하게 보관할 수 있는 방법을 원하는 사람들에게는 지금이라도 유용할 것으로 보고 있다.

조지아공대 사이버보안정보보호·기기평가연구소의 수석과학자 니컬러스 가이즈는 기술매체 와이어드에 “영원히 간직하고 싶지만 자주 찾아보지는 않는 데이터가 DNA 저장에 적합하다”고 말했다. 그는 특히 방대한 아카이브를 저장해야 하는 기업과 정부에 DNA 저장 시스템이 앞으로 가장 매력적일 수 있다고 덧붙였다.

매사추세츠공대(MIT) 마크 베이드 교수(생명공학)는 “많은 사람이 관심을 가질수록 비용 절감과 규모 확대를 위한 투자가 이뤄져 DNA 저장 비용이 저렴해질 것”이라고 말했다.

바이오메모리는 12월에 주문을 받아 1월 초에 첫번째 DNA 카드를 발송할 예정이다. 이후 몇달 안에 사진, 동영상도 저장할 수 있도록 용량을 확대한 제품도 내놓을 계획이다.

마이크로소프트가 개념증명 실험을 위해 워싱턴대와 공동으로 개발한 DNA 데이터 저장-검색 시스템. 마이크로소프트 제공

2012년 대규모 저장장치 가능성 확인

DNA를 이용해 데이터를 저장할 수도 있겠다는 생각은 1950년대에 등장했지만 실제 저장장치로서의 가능성을 확인한 것은 10여년 전이다. 2012년 조지 처치 교수(유전학)을 비롯한 미 하버드대 과학자들이 5.27메가바이트 용량의 데이터를 DNA에 저장하는 데 성공했다. 이후 정부 기관의 지원 아래 학계를 중심으로 DNA 저장 시스템 연구가 이어지고 있다.

기업 쪽에선 마이크로소프트가 DNA를 비롯한 차세대 저장장치 개발에 적극적이다. 마이크로소프트는 2017년 200메가바이트의 데이터를 저장하고 검색하는 데 성공한 데 이어, 2019년엔 워싱턴대와 공동으로 1기가바이트의 데이터를 저장하고 검색할 수 있는 시스템의 개념증명 실험에 성공했다.

이밖에 트위스트 바이오사이언스(Twist Bioscience), 캐털로그(Catalog), 디엔에이 스크립트(DNA Script) 등이 DNA 저장장치 개발에 나서고 있다.

곽노필 선임기자 nopil@hani.co.kr

Copyright © 한겨레. All rights reserved. 무단 전재, 재배포 및 크롤링 금지.

이 기사에 대해 어떻게 생각하시나요?