데이터 홍수 걱정 없는 저장장치의 차세대 주자들

이병철 기자 2021. 2. 27. 09:00
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

전통적인 영화 필름(왼쪽)과 마이크로소프트에서 개발한 유리판 저장장치의 모습. 손바닥 크기의 유리판 저장장치를 사용하면 필름 4통이 필요한 영화 한 편을 저장할 수 있다. 마이크로소프트 제공

빅데이터와 인공지능(AI)을 일상적으로 활용하게 되면서 막대한 양의 데이터를 다루고 저장하는 기술에도 혁신이 일어나고 있다. 하드디스크드라이브(HDD)와 솔리드스테이트드라이브(SSD)를 넘어서는 미래 데이터 저장 기술을 살펴봤다.

온라인에서 볼 수 있는 사진과 영상, 문자 등의 데이터는 0과 1의 두 가지 숫자를 사용하는 2진법으로 기록된다. 현재 널리 사용되는 저장매체인 하드디스크드라이브(HDD)와 반도체 방식의 저장매체인 솔리드스테이트드라이브(SSD)는 2개의 2진법 데이터를 하나의 단위(비트)로 사용해 정보를 기록한다.

2진법으로 데이터를 기록하는 이유는 데이터의 보관과 처리에 따른 오차를 최소화하기 위해서다. 2진법 데이터는 전류가 흐르면 1, 흐르지 않으면 0으로 표시된다. 3진법으로 데이터를 저장한다면 전류의 세기에 따라 입력되는 데이터가 결정되는데, 0과 2 사이의 1이 입력되는 전류의 세기에 따라 0 또는 2로 잘못 기록될 수 있다.

정보를 단 두 개의 숫자로 표기해야 하기 때문에 저장 공간이 상대적으로 많이 필요하다는 점은 단점으로 꼽힌다. 십진법으로 표기하면 ‘10’이라고 두 글자로 저장하면 되는 정보가 이진법에서는 ‘1010’이라고 네 글자로 표기돼야 한다.

막대한 정보를 실시간으로 다루는 마이크로소프트, 구글 등 정보통신(IT) 기업은 데이터센터 크기를 늘리는 방식으로 대응하고 있다. 이를 위해 이전에는 건설하지 않던 곳까지 데이터센터를 개설하며 공간 문제 해결에 나서고 있다. 2015년 마이크로소프트가 ‘나틱 프로젝트’라는 이름의 데이터센터 건설 계획을 발표한 게 대표적이다. 넓은 부지가 필요한 데이터센터를 공간의 제약이 상대적으로 적은 바다 속에 건설하는 프로젝트로, 저장장치에서 발생하는 열과 소음, 진동까지도 관리할 수 있는 기발한 대안으로 평가받았다.

하지만 이런 노력도 결국 기존 방식의 데이터 저장장치를 사용하는 만큼 기존 저장장치의 근본적 문제점에서 벗어날 수 없다는 한계가 있다. 이에 연구자들은 데이터를 저장할 전혀 새로운 형태의 기술에 주목하고 있다.

과거 기술의 재발견, 자기테이프

자기테이프 저장장치는 필름에 코팅된 물질의 자성의 방향에 따라 데이터를 저장한다. 주로 과거에 사용됐지만, 최근에도 대용량 저장장치로 각광받고 있다. 후지필름/게티이미지뱅크 제공

과거에 사용됐지만 현재는 주류에서 완전히 밀려난 구식 기술이 최근 새로운 저장기술로 다시 주목 받고 있다. 1990년대에 음악과 영상 기록 및 재생을 위해 사용한 자기테이프 저장장치다. 카세트테이프, 비디오테이프라고 불리며 실생활에서 널리 사용됐지만, 컴퓨터와 HDD, SSD가 보급되면서 현재는 거의 사용되지 않고 있다. 

자기테이프는 플라스틱 테이프 표면에 산화철 등 자성을 띠는 재료를 코팅한 장치다. 데이터를 저장하고 읽을 때는 전자석 원리와 전자기유도 현상이 사용된다. 자기테이프를 전자석 부근에 통과시키면 자기장이 유도되며 자기테이프가 띈 자성이 한 방향으로 정렬되는데, 자성의 방향에 따라 0과 1의 디지털 데이터가 입력된다. 가령 연속된 자성의 방향이 같으면 0, 다르면 1이 새겨진다.

자기테이프는 반도체 기반 저장장치에 비해 저장용량이 크고 안정성이 우수하다는 게 장점이다. 반도체 기반 저장장치는 정보를 쓰고 읽기 위해 수많은 장치가 필요하지만, 자기테이프는 필름만으로 구성돼 장치도 매우 단순하고, 고장 나거나 데이터에 손실이 생길 위험성도 적다.

이 때문에 일부 기업에서는 여전히 대용량의 데이터를 보관하기 위해 자기테이프를 사용하고 있다. 최근에는 소재의 발전에 힘입어 저장용량이 계속 증가하면서 더욱 활용폭이 넓어지고 있다. 지난해 12월 일본의 정밀화학기업 후지필름과 미국의 IT기업 IBM은 신소재를 이용해 580TB(테라바이트·1TB는 1024GB)에 달하는 저장용량을 가진 자기테이프 저장장치를 개발했다고 발표했다. 이는 현재 가장 널리 사용되는 자기테이프 모델(LTO8)보다 약 50배 용량이 큰 수준이다.

연구팀은 지금까지 자기테이프에 사용된 소재인 바륨 페라이트 대신 더 작은 크기의 나노입자를 만들 수 있는 스트론튬 페라이트를 사용했다. 정보를 저장하는 개별입자가 높은 밀도로 구성되는 만큼 더 많은 비트에 데이터를 저장할 수 있다.

유리판에 데이터를 저장하는 기술도 등장했다. 2019년 마이크로소프트는 2mm 유리판에 수백 년 이상 데이터를 손실 없이 보관할 수 있는 ‘프로젝트 실리카’ 기술을 발표했다. 초미세 가공이 가능한 펨토초 레이저를 이용해 유리판 내부의 구조를 두 가지 형태 중 하나로 영구적으로 변형시키고, 이 변형된 구조를 이용해 2진법 데이터를 저장하는 기술이다. 이 기술은 물리적으로 안정적인 구조를 데이터화하는 만큼 데이터를 장기적으로 보관하는 데 유리하다. 마이크로소프트는 프로젝트 실리카 기술을 이용하면 클라우드에 저장된 정보를 안전하고 효율적으로 관리할 수 있다고 설명했다.

대신 이미지 정보 담은 DNA

자기테이프나 유리판의 저장성능이 아무리 뛰어나다고 해도 비트마다 2종류의 정보를 적용할 수 있다는 점은 반도체 기반 저장장치와 크게 다르지 않다. 그래서 일부 연구자들은 한 개의 비트에 3종류 이상의 정보를 담아 데이터 저장량을 늘리는 연구를 하고 있다.

대표적인 사례가 생명체의 유전정보를 담고 있는 물질인 DNA를 이용하는 기술이다. 사람을 비롯해 모든 생명체는 DNA에 저장된 정보를 이용해 다양한 특성(표현형)을 나타낸다. 사람은 약 3Gbp(기가베이스페어·염기쌍을 세는 단위. 1Gbp는 염기쌍 10억 개를 의미)의 DNA를 지니고 있다. 디지털 정보로 본다면 약 30억 개의 비트가 저장된 셈이다. 보통 8비트를 1바이트의 디지털 저장용량으로 계산하므로, DNA 1개에는 375MB(메가바이트·1MB는 100만 바이트)의 데이터가 저장될 수 있다.

하지만 DNA는 2진법으로 정보를 저장하지 않는다. DNA를 구성하는 염기는 아데닌(A), 티민(T), 구아닌(G), 사이토신(C) 등 총 4가지가 존재하기 때문에 1개 비트에 총 4개의 정보를 저장할 수 있다. 4진법 데이터 저장장치를 구현하는 셈이다. 단순계산해, 10개의 비트(DNA 염기쌍)에 약 100만 개(410개)의 정보를 저장할 수 있다. 2진법을 쓰는 디지털 저장장치가 10개 비트로 표현 할 수 있는 정보는 1024(210)개뿐이다.

DNA는 사용자가 원하는 염기서열로 손쉽게 합성하고 복제할 수 있다는 장점도 있다. 이런 특성을 활용해 DNA를 고분자 저장장치 재료로 사용하기 위한 연구가 활발히 이뤄지고 있다.

비록 정보를 저장한 DNA를 전자회로가 아닌 가루 형태로 보관해야 해 정보를 수시로 저장하고 불러오거나 원하는 정보만을 골라 찾는 데 한계도 있지만, 이에 대한 해결책도 연구되고 있다. 권성훈 서울대 전기정보공학부 교수와 박욱 경희대 전자공학과 교수팀은 서로 다른 정보를 디스크에 결합해 보관하는 형태의 DNA 저장장치를 개발해 지난해 7월 국제학술지 ‘어드밴스드 머티리얼스’에 발표했다. 연구팀은 고분자 섬유로 만든 QR코드 모양의 디스크를 제작했다. 고분자 섬유에는 각각 대동여지도, 훈민정음 해례본 등의 이미지를 저장한 DNA 분자를 화학적으로 결합했다.

그리고 저장된 DNA 염기서열 정보를 복제할 때 복제를 시작하는 역할을 하는 짧은 염기서열인 프라이머 정보는 QR코드에 저장해 QR코드만 스캔하면 저장된 이미지를 읽을 수 있도록 했다. 저장된 데이터를 불러올 때는 세포가 DNA를 복제하는 방법을 그대로 사용했다. 단일가닥 DNA에 프라이머가 결합해 이중가닥 DNA로 복제되면 새로 합성된 DNA 가닥이 분리되고 여기에 다시 프라이머가 결합해 계속해서 DNA 정보가 복제되는 방식이다. 복제된 DNA 가닥을 통해 염기서열을 해독하고 이를 다시 디지털 신호로 번역하면 저장된 이미지를 읽어낼 수 있다. doi: 10.1002/adma.202001249

박 교수는 “DNA 저장장치는 오랜 기간, 많은 양의 데이터를 저장해야하는 분야에서 활용가치가 크다”며 “특히 많은 양의 데이터가 필요한 헬스케어 산업 등에서 중요하게 활용될 수 있다”고 설명했다.

화학 분자에 새긴 피카소 작품

미국 브라운대 연구팀이 개발한 화학분자 저장장치로 저장한 이미지(왼쪽)를 불러오는 데 성공했다. 여기에 사용된 이미지는 피카소의 작품 ‘바이올린’이다. 네이처 커뮤니케이션 제공

DNA 같은 고분자가 아닌 개별 분자를 활용한다면 더 작은 공간에 많은 데이터를 저장할 수 있다. 최근에는 여러 개의 분자를 하나의 분자로 합성하는 우기반응(Ugi reaction)을 이용해 데이터를 화학물질에 저장하는 방식이 연구되고 있다.

제이콥 로젠스타인 미국 브라운대 전자공학과 교수가 이끄는 공동연구팀은 아민, 알데하이드, 카르복실산, 아이소시안화물 등 4종류의 작용기를 가진 분자를 이용해 약 1500종류의 분자를 합성했다. 합성된 분자에는 각각 비트 순서를 부여하고 해당 분자가 존재하는 경우 1을, 존재하지 않는 경우 0의 신호로 해석했다. 1500개 분자를 사용하면 1500비트의 데이터를, 3000개의 분자를 사용하면 3000비트의 데이터를 저장할 수 있는 셈이다. 연구팀은 피카소의 그림 작품을 해당 방식으로 저장했다가 다시 읽어내는 실험을 진행했다.

연구팀은 분자에 저장된 정보를 다시 재현하기 위해 각각의 분자를 구분해 분석할 수 있는 질량분석 방법을 사용했다. 그 결과 저장된 이미지를 오차율 0.11% 이내로 재현하는 데 성공했다. 연구 결과는 국제학술지 ‘네이처 커뮤니케이션스’ 지난해 2월 4일자에 발표됐다. doi: 10.1038/s41467-020-14455-1

분자를 이용한 데이터 저장은 단지 한정된 공간에 저장할 수 있는 데이터 양을 늘린 것 이상의 가치를 갖는다. 연구팀은 액체에 녹아있는 화학 분자에 데이터를 저장하는 데 성공한 만큼 유연한 기판이나 3차원 표면에 정보를 입력할 수 있을 것이라고 주장했다. 연구팀은 정보를 3차원으로 저장하게 되면 이미지 인식과 검색 알고리즘 등 인공지능(AI) 관련 최신 연구 분야에 활용가치가 높다고 분석했다.

이 연구에 참여한 김은숙 브라운대 화학과 교수는 “다양한 과학 분야에서 데이터의 중요성이 높아지고 있는 만큼 새로운 형태의 저장장치 개발이 필요해지고 있다”며 “당장은 반도체 기반 저장장치만큼의 효율을 내는 데 어려움이 있지만, 새로운 형태의 저장장치가 폭넓게 사용되는 시대가 올 것”이라고 말했다.  

※관련기사

과학동아 2월호, 데이터 홍수 문제없다 '데이터 저장장치' 

[이병철 기자 alwaysame@donga.com]

Copyright © 동아사이언스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?