아는 사람만 아는 파일 압축의 세계
'압축'이라는 말은 표준국어 대사전에 따르면 ‘물질 따위에 압력을 가하여 그 부피를 줄이는 것’을 의미한다. 이 단어는 PC 유저들 사이에서도 꾸준히 사용되어 왔는데, 그들에게 압축이란 단어는 복수의 파일을 묶는 작업 혹은 데이터를 더 작은 크기로 변환시키는 작업으로 통했다.
이는 당연히도 저장 공간의 절약 또는 파일 전송의 시간 단축 등의 목적으로 행해졌으며, 파일이나 데이터의 이동 또는 전송 시의 무결성(데이터에 대한 정확성, 일관성, 유효성, 신뢰성을 보장하기 위해 항상 데이터를 정상적으로 유지하는 것) 보장을 위해서도 이 압축 기능을 사용하기도 했다.
이러한 컴퓨터에서의 압축 기술은 방식마다 시작 지점이 제각각이지만 미디어 파일의 압축 개념이 아닌, 우리가 보통 ‘압축 파일’이라 이야기하는 일반적인 PC 파일 압축의 경우 80년대 후반부터 개념이 잡히고 실제 사용된 것으로 여겨진다. 그리고 우리가 이런 압축 파일을 본격적으로 사용하게 된 것은 16비트 IBM-PC 호환 컴퓨터들이 대세가 되면서 지정된 플로피 디스크 용량 내에서의 프로그램 공유를 위한 목적과 PC 통신 사용자가 조금씩 늘어나면서 커뮤니티 자료실에서의 자료 공유의 목적이 컸다고 봐도 좋을 것이다.
압축은 변환 과정을 통해 진행된 뒤 이후 복원 과정을 통해 원상 복구되는 프로세스로 적용됐다. 또한, 데이터의 내용을 바꾸지 않고 원래 내용 그대로 디코딩 되는 ‘무손실 압축’과 압축률은 높지만, 디코딩 시 원본 데이터의 일부가 소실되는 가능성이 존재하는 ‘손실 압축’ 등으로 구분되었다.
당연히 과거의 파일 압축은 ‘무손실 압축’, 이미지, 음원, 영상 등의 압축에는 ‘손실 압축’ 방식이 구분되어 사용됐었다. 그러나 최근에는 저장 장치의 용량이 어마어마하게 늘어나고 데이터 전송 속도가 비약적으로 빨라졌다. 덕분에 ‘손실 압축’의 압축 효율의 의미가 점점 퇴색되고 심지어 어마어마한 용량의 ‘무손실 압축’ 방식을 사용하는 유저도 많아져 압축과 복원을 담당하는 '코덱'과 '압축 규격'이 예전만큼 다양하지는 않게 되었다.
메이저와 마이너가 분명한 PC 파일용 압축 파일 규격
위에서 언급한 미디어 파일의 압축 개념이 아닌, 우리가 보통 ‘압축 파일’이라 이야기하는 일반적인 파일 압축의 경우 과거부터 흥망성쇠를 겪어온 종류만 해도 60여 개가 넘는다. 이 중 가장 유명한 것들을 꼽자면 ARC나 ZIP, ARJ, LZH, RAR 등이 아닐까?
1985년 미국의 SEA(System Enhancement Associates)에 의해 ARC가 탄생한 후 1989년 압축률이 개선되고 사용 플랫폼도 더 폭넓었던 ZIP이 필 캐츠의 PK웨어를 통해 등장했다. 하지만, ZIP은 완벽하게 재탄생한 규격이 아니었다. 저작권 소송전 결과 ARC 알고리즘의 무단 사용이 밝혀진 것이다. 그러나 인생사 새옹지마라고 했다. 소송에서 패배한 PK웨어가 이를 계기로 더 성능이 좋은 ZIP 규격을 선보이게 되었으며, 아예 ZIP 파일 형식 사양을 공개해 지금까지 꾸준히 사랑을 받도록 한 원동력이 된 것이다.
더불어 1990년대 초 DOS 기반으로 활약한 ARJ는 '분할' 압축 기능이 가장 큰 특징이었다. 분할 압축은 전송 속도가 느렸던 모뎀 시절 파일 전송에 소요되는 시간을 효율적으로 관리하기 위해 요긴하게 사용되던 방법이다. 모뎀을 사용하는 순간엔 전화를 사용하지 못하므로 PC 통신 게시판이나 사설 BBS에 수십 MB 급 파일을 업로드, 혹은 전송하려 할 땐 으레 1MB씩 ARJ 파일 여러 개로 분할 압축해 장시간 전화 불통 사태를 방지하곤 했다. 그리고 플로피 디스켓으로 데이터를 전송할 때도 디스켓 한 장 용량씩 분할 압축하여 박스째 주고받았다.
일본 쪽 파일을 많이 사용해 본 사람이라면 친숙할 LZH 파일 형식은 게임 데이터를 압축하는데 많이 사용되었다. ID소프트의 ‘둠’ 인기에 편승해 ZIP과 RAR로 압축 파일 환경이 양분되기 전까지 꾸준한 인기를 누렸었다. 파일의 무결성에 아쉬운 모습을 보이며 메이저로 오래 자리 잡지는 못했지만 한때 KOEI의 시뮬레이션 게임이나 소위 미연시 게임을 자주 다루던(?) 유저들에게는 이 LZH가 필수 도구라 할 수 있었다.
한편 소련 붕괴 직후인 1993년에 유진 로샬에 의해 탄생한 RAR은 다른 압축 포맷들과 비교해 더욱 높은 압축률을 보여주면서도 분할 압축 지원, 분할 크기 수동 입력, 복구 기록까지 지원하며 ARJ를 제치고 새로운 분할 압축의 강자가 되었다. DOS 시절 CUI로 활약한 시간은 의외로 짧았고 Windows GUI로 재탄생하여 프리웨어로 유통되었을 때의 이미지가 더 강한 프로그램이다. 특히 PC 하드웨어의 번들 CD에 드라이버 설치용으로 많이 배포되었다.
멀티 규격 지원부터 생성 폴더명이 더 유명했던 압축 프로그램들
이러한 압축 파일을 사용하기 위해서는 압축과 해제 기능을 지원하는 프로그램들을 사용해야 했다. 초기에는 압축용 프로그램과 해제용 프로그램이 각각 따로 존재했다. 잘 알려진 ZIP 파일도 처음에는 압축을 위한 PKZIP.EXE 프로그램과 복원을 위한 UNZIP.EXE 프로그램을 따로 실행시켜야 했다. 하지만 필 캐츠가 제품 상표권과 기술 개념에 대한 권리를 지키지 못한 사이 PC 사용 보조 프로그램을 벗어나 중심 OS로 자리 잡은 Windows 기반으로 제작된 WINZIP이 그 자리를 차지하며 압축과 해제 기능이 하나의 프로그램 속에 통합되었다.
이어 동명의 형식을 사용할 수 있는 7Z라는 프로그램이 러시아를 통해 등장했다. 7z은 프리웨어라는 점과 이중 압축, 강화된 보안 기능 등 편의성 기능이 다수 추가되어 지금도 적지 않은 팬층이 많은 편이다. RAR 기능을 위한 WINRAR의 경우 좋은 성능과는 별개로 셰어웨어 형식으로 배포가 되었기에 기업은 물론 개인 사용자 역시 쉽게 손을 대지 못했으며, 지금도 PC 사용자들 사이에서는 “WINRAR의 라이선스를 가지고 있는 사람은 부자다.”라는 우스갯소리가 돌고 있다.
한편 우리나라에서도 90년대 중후반부터 ZIP과 ARJ, LZH, RAR 등 다양한 방식을 지원하는 통합 압축 프로그램이 우후죽순처럼 등장했는데 이스트 소프트의 알집(ALZIP)이 프리웨어로 최초 배포되며 빠르게 자리를 잡았다. 이 프로그램의 경우 ALZ나 EGG와 같은 독자 규격을 가지고 있었고 폴더를 만드는 기능에 실제 존재하는 새의 이름을 붙이며 인기를 모아 우리나라에서 새로운 표준이 될 수도 있었으나 2001년 셰어웨어로 정책이 바뀌며 사용자들이 이탈하기도 했다.
대신 반디소프트의 반디집이 기업과 공공기관에서도 무료로 사용이 가능한 정책과 국내산 제품 중 최고급이라 해도 좋을 성능, 편리한 인터페이스 등에 힘입어 알집의 대안으로 떠올랐다. 이후 반디소프트가 기존 무료 기반에 광고가 노출되는 스탠더드 에디션과 전문가들을 위한 최신 기능이 탑재된 프로페셔널 에디션, 그리고 기업을 위한 안정적인 성능의 엔터프라이즈 에디션 등으로 제품군을 세분화했으나 현재까지도 스탠더드 에디션의 상업적 사용을 허가하고 있는 중이다.
언제나 파일은 소중해
그 외에도 수많은 형식의 압축 파일들이 태어나 저마다의 목적에 맞춰 사용되고 있으며 이는 예나 지금이나 파일 관리와 파일 무결성, 용량 축소, 편리한 전송이 사용자들에게 중요하게 자리잡고 있다. 조금만 민감하게 저장소 관리를 하는 사람에게 있어 이런 압축 프로그램과 압축 파일은 ‘평생을 함께하는 동지’라 부르는 것도 이와 같은 이유 때문이다.
이러한 수요에 힘입어 1998년부터는 마이크로소프트도 윈도우에 압축 기능을 넣기 시작했지만 인터페이스와 성능적인 한계로 아직 위에서 소개한 별도 프로그램의 자리를 완전히 대체하지는 못하는 중이다.
과연 우리는 실생활 중 알게 모르게 이러한 다양한 압축 기능과 관련 프로그램 중 얼마나 활용하고 있는 것일까? 쉽게 지나칠 수도 있는 이야기지만 조금만 관심을 가지고 지켜본다면 또 다른 재미가 보일 지도 모르는 일이다.
기획, 편집 / 다나와 정도일 doil@cowave.kr
글 / MrEGOIST news@cowave.kr
(c) 비교하며 잘 사는, 다나와 www.danawa.com