아날로그 5·18 기록물, AI 아카이브 구축 시급하다

광주일보 2026. 5. 22. 01:39
음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

연구자들, ‘데이터 대전환’ 촉구…역사적 맥락 검증·정의로운 해석 담보
1만4500건 자료, 단행본·사진·영상으로 보관…왜곡·은닉된 군 기록물도
21일 광주시 북구 전남대 인문대학 1호관 김남주홀에서 열린 제3회 5·18연구자 대회에 참석한 연구자와 시민들이 5·18 AI아카이빙과 K-민주주의 세션 발표를 경청하고 있다. /나명주 기자 mjna@kwangju.co.kr
5·18 기록물이 인공지능(AI) 시대에도 디지털 아카이브를 파일로 보관하는 수준으로 관리되고 있다는 지적이 나왔다.

단순 디지털 전산화와 컬렉션에서 벗어나 자료의 역사적 맥락을 검증하고 ‘정의로운 해석’을 담보할 수 있는 인공지능 아카이브 구축이 시급하다는 것이다.

21일 전남대에서 열린 ‘제3회 5·18연구자 대회’ 세션 8 ‘5·18 AI아카이빙과 K-민주주의’ 세션에서 연구자들은 ‘데이터 대전환’을 촉구했다.

유인태 전남대 교수는 전남대 5·18연구소가 보유한 1만 4500건의 기초 자료 가운데 상당수가 단행본·자료집·마이크로필름 같은 아날로그 형태로 남아 있고, 디지털 변환을 마친 자료도 이미지(JPG)·문서(PDF)·동영상(MP4) 파일 수준에 머물러 있다고 지적했다. 명칭·관리번호·시기·출처 등 기존 메타데이터 역시 관리자 편의에 가까운 형식적 틀에 머물러 있다.

유 교수는 대안으로 ‘시맨틱 데이터’와 ‘지식그래프’ 기반의 데이터 아카이브 구현 전략을 제시했다.

자료를 ‘S-P-O(주어-서술어-목적어) Triple’ 구조로 재설계하고, 거대언어모델(LLM)과 결합한 GraphRAG 환경에서 신뢰성 있는 큐레이션을 수행하자는 구상이다.

전남대가 지난해 글로컬대학30 실행계획의 핵심과제로 ‘5·18 아카이브의 AI 전환’을 설정한 후속 청사진이다.

군 기록물의 구조적 문제점은 김희송 전남대 교수가 본격적으로 짚었다.

김 교수는 “보안사가 5·18 관련 군 자료 중 ‘문제 소지 있는 자료’를 일괄 폐기한 뒤 일부만 선별 보관했고, 1989년 국회 광주청문회에는 조작된 국보위 보고서가 제출됐다”고 꼬집었다.

의혹으로만 떠돌던 5·18 왜곡 조직 ‘80위원회’ 문서는 마이크로필름 기록물 더미에 우연히 섞여 있다가 발견됐고, ‘511연구위원회’ 자료는 군사편찬연구소 지하 서고의 별도 시건장치 캐비넷에서 확인됐다 점에서다. 군 기록물이 권력에 의한 ‘한정과 배제’의 결과물임을 보여주는 사례다.

김 교수는 “2018년 국방부 5·18특별조사위가 511연구위원회를 5·18 왜곡의 주도 조직으로 적시했음에도, 5·18기념재단이 국방부가 39권 4981쪽으로 선별 제공한 자료만으로 ‘육군 80대책위 주도론’을 폈다”고 비판했다.

토론자인 김희랑 5·18민주화운동기록관 연구실장은 “군 기록물이 국방부·국가기록원·군사안보지원사령부·육군기록정보관리단·군사편찬연구소·서울중앙지검 등에 분산돼 있어 이력의 역사적 맥락 추적이 구조적으로 불가능하다”고 짚었다.

그는 통합 목록 구축, 원본 대조·판본 비교·출처 검증 체계 마련, 폐기·은닉된 ‘부재 기록’의 추적과 공백 자체의 기록화, 피해자·유족·연구자·시민사회가 함께 참여하는 해석 거버넌스의 제도화를 후속 과제로 제시했다.

5·18 사진과 영상의 데이터 공백도 도마에 올랐다.

김지선 덕성여대 역사문화연구소 연구원은 5·18민주화운동기록관이 ‘문서·간행물’ 3472건과 ‘사진·필름’ 860건을 공개하고 있으나, 사진 자료의 ‘인물’ 항목에는 피사체가 아닌 촬영자가 입력돼 있고 ‘시간’ 값은 공란인 사례가 대다수라고 지적했다. 인물·장소·사건을 매개로 분산 자료를 연결하는 데이터 층위의 환경이 사실상 부재하다는 의미다.

최유식 전남대 사회과학연구소 연구원은 “1980년 말 광주시·광산군의 지명이 행정구역명 522개, 지번주소 35만 2122개, 가로명 24개로 확인된다”며, “최신 지명만 학습한 AI는 1980년 지명을 판독할 수 없는 만큼 시점을 1980년으로 고정한 옛 지명 데이터셋과 GeoAI 결합이 필수”라고 제언했다. 광주시가 7월 전남광주통합특별시 출범을 앞두고 행정구역이 또 한 차례 바뀌는 만큼 작업이 더 시급하다는 진단이다.

/정병호 기자 jusbh@kwangju.co.kr

Copyright © 광주일보. 무단전재 및 재배포 금지.