세상에서 가장 작은 도서관, DNA
DNA에 정보를 저장하는 게 새로운 기술은 아닙니다. DNA는 지구에 생명체가 등장한 이후 수십억 년 동안 쭉 생물의 유전 정보를 저장하는 물질이었어요. DNA 저장 장치는 기존 저장 장치와 무엇이 다른걸까요.
○ 엄청나게 작고 엄청나게 안전한 DNA
● 첫 DNA 저장 장치 출시
2023년 12월 프랑스의 바이오 기업 바이오메모리는 DNA 저장 장치를 출시한다고 발표했습니다. 이 회사는 1000유로(약 140만 원)를 내면 1KB(킬로바이트)를 저장할 수 있는 DNA 칩을 제공할 계획입니다. 1KB는 띄어쓰기 없이 한글로 341글자를 저장할 수 있는 용량입니다. 최근 개인용 컴퓨터에 쓰이는 저장 장치 용량의 단위가 1TB(테라바이트)인 것을 감안하면 아주 적은 양입니다.
바이오메모리 에르판 아르와니 대표는 “아직 용량은 다소 적지만 기술의 가치를 보여주고 싶었다”고 밝혔습니다. 사람들이 DNA 저장 장치에 주목하는 이유는 무엇일까요.
DNA 저장 장치의 가장 큰 장점은 작은 공간에 많은 데이터를 저장할 수 있다는 점입니다. 이론상 DNA 1g에는 수백 PB(페타바이트)의 정보를 저장할 수 있어요. 1PB는 1TB보다 1024배 큰 용량입니다.
최영재 광주과학기술원 신소재공학부 교수는 “현재 가장 높은 수준의 반도체 회로 사이 간격은 2nm(나노미터, 10억분의 1미터)인데 DNA의 정보 단위인 염기 사이의 간격은 이보다 훨씬 짧은 0.34nm”라며 “DNA는 반도체보다 정보를 훨씬 촘촘하게 저장할 수 있다”고 설명했습니다.
DNA는 매우 안정적인 물질로 보존 기간이 길고 보관이 까다롭지 않습니다. 최 교수는 “수백만 년 전 화석의 DNA를 해독할 수 있듯이, 수분을 제거한 DNA는 변질될 우려가 거의 없다”고 말했습니다.
현재 널리 쓰이는 저장 장치인 하드 디스크 드라이브(HDD)나 솔리드 스테이트 드라이브(SSD)의 수명은 길어야 수십 년 정도입니다. 또 전기에너지를 계속 공급받지 않으면 정보가 사라지거나 변형될 위험이 있는 전자 저장 장치와 달리 DNA는 별다른 연결 없이 상온에서 보관하면 충분하기 때문에 에너지도 아낄 수 있습니다.
○ 영화를 DNA에 저장한다
● 0과 1로 된 디지털 정보를 염기서열로
우리가 컴퓨터에서 볼 수 있는 정보의 가장 작은 단위는 무엇일까요. 0(없음) 또는 1(있음)의 두 가지 상태만을 나타내는 비트(Bit)입니다. 비트 8개가 모여 ‘10011010’과 같이 정보를 표현한 단위를 바이트(Byte)라고 해요. 1바이트는 알파벳이나 숫자 1개를 표현합니다. 복잡한 정보도 컴퓨터에서는 모두 0과 1로 변환해 나타낼 수 있습니다.
반면 DNA에서 정보를 표현하는 단위는 A, C, G, T 4개입니다. 그래서 디지털 정보를 DNA로 바꾸려면 먼저 규칙을 정해야 합니다. A와 T는 0으로, C와 G는 1로 정할 수도 있고 A는 00, C는 01, G는 10, T는 11과 같이 약속할 수도 있어요.
규칙에 따라 정보를 ‘GAACGTCT’와 같이 염기서열로 바꿨다면 순서에 맞게 DNA를 조립해야 합니다. G 다음에 A를 결합하고, 또 A를 결합하는 식입니다.
유전자 합성 기술을 연구하는 기업인 ATG라이프텍 류태훈 대표는 “DNA를 정해진 서열대로 합성하는 과정이 가장 까다롭다”고 설명했습니다.
DNA를 합성하는 동안에는 서열 중간에 오류가 발생했는지 확인하기 어려워 매 과정을 꼼꼼하게 진행하느라 시간이 오래 걸리기 때문입니다. 이후 DNA 조각은 건조 과정을 거칩니다. 류 대표는 “수분이 있으면 DNA가 파괴되거나 변질될 수 있다”고 덧붙였습니다.
DNA에 저장된 정보를 읽어내는 과정은 저장하는 과정보다 훨씬 수월합니다. 류 대표는 “빛을 쬐어 염기서열을 읽는 광학 장치를 사용하면 1조 쌍 정도의 염기서열은 이틀이면 파악할 수 있다”고 말했습니다. 해독한 염기서열을 처음 약속한 규칙에 따라 다시 0과 1로 된 디지털 정보로 변환하면 컴퓨터에서 사진이나 영상 등 원본 정보를 확인할 수 있어요.
광주과학기술원 최영재 교수는 “DNA저장 장치가 발전하기 위해서는 오류를 줄이면서도 효율적으로 DNA를 합성하는 기술이 관건”이라고 분석했습니다.
○ 우주에서도 문제 없다! DNA
● 폭발적으로 늘어나는 데이터를 보관하려면
2018년 IT분야 분석 기관인 국제데이터코퍼레이션(IDC)은 인류가 만든 모든 정보의 용량이 2025년 기준 175ZB(제타바이트, PB의 약 100만 배)에 달할 것으로 예상했습니다. 정보가 늘어나는 속도도 점점 빨라질 것으로 내다봤죠.
최영재 교수는 “모든 정보가 인공지능의 학습에 쓰이는 등 사람들에게 이득을 주기 때문에 사람들은 정보를 지우기보다 가능한 한 저장하려고 할 것”이라고 분석했습니다.
늘어나는 정보는 보관할 장소를 마련하기 어려울뿐더러 에너지 문제와도 연결됩니다. 국제에너지기구(IEA)는 2020년 기준 전 세계 데이터센터가 지구 전체 전력 소모의 1%를 차지했다고 발표했어요. 데이터가 늘어나면 이 비율도 점점 증가합니다.
최 교수는 “데이터센터에 있는 저장 장치는 늘 전원이 연결된 상태로 정보가 변형되거나 손실되지 않도록 항상 검사 프로그램이 작동 중”이라고 설명했습니다.
그런데 사람들이 저장된 모든 정보를 자주 꺼내 보는 것은 아니에요. 최 교수는 “5년 이상 확인하지 않고 장기 보관하는 ‘콜드 데이터’의 비율이 전체의 20~25% 정도일 것으로 추정된다”고 설명했습니다. 보관용 데이터를 DNA로 저장하면 공간도 적게 차지하고 보관에 필요한 에너지도 줄일 수 있어요.
인류의 지식을 우주나 다른 행성으로 들고 가야 할 때도 DNA 저장 장치가 해결사 역할을 할 수 있습니다. 류태훈 대표는 “우주선의 무게를 줄이는 것이 중요하기 때문에 많은 정보를 들고 갈 때는 DNA 저장 장치가 유리할 것”이라며 “DNA는 안정적인 물질이어서 극지방이나 지구 밖의 극한 환경에서 정보를 보관하기에 적합하다”고 덧붙였습니다.
● 인터뷰
“DNA 저장 장치는 기존 저장 장치와 공존할 것입니다”
Q. DNA 저장 장치도 해킹할 수 있나요.
A(류태훈 ATG라이프텍 대표). "DNA를 합성할 때는 정보가 있는 부분 앞에 프라이머라고 하는 특정 염기서열을 추가합니다. 이 배열을 정확히 알지 못하면 정보를 읽어낼 수 없어요. 길이가 20 염기쌍 정도 되는데 이 정도만 해도 경우의 수가 1조가 넘습니다. 게다가 DNA는 해킹을 시도하면 그 DNA를 더 이상 쓸 수 없기 때문에 DNA 저장 장치는 보안이 강력한 편이라고 볼 수 있어요."
Q. DNA가 우리 일상의 저장 장치를 대체할까요.
A(최영재광주과학기술원 신소재공학부 교수). "DNA는 정보를 저장하고 다시 불러오는 읽기쓰기 속도가 매우 느립니다. 그래서 꼭 보관해야 하지만 자주 확인할 필요 없는 자료를 보관하는 데 적합해요. 매번 수정해야 하는 정보는 계속 기존 저장 장치가 담당할 거예요. DNA 저장 장치는 미래에 기존 저장 장치와 함께 상호보완적으로 활용될 것입니다."
※관련기사
어린이과학동아 2월 1일, [특집] 세상에서 가장 작은 도서관, DNA
[이병구 기자 2bottle9@donga.com]
Copyright © 동아사이언스. 무단전재 및 재배포 금지.