이파피루스, 민감정보 비식별화 부가기능 '블랙마커' 업그레이드
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
문서 AI 기업 이파피루스(대표 김정희)는 민감정보 비식별화 모듈 '블랙마커(BlackMarker)'의 성능을 업그레이드, 대표 제품인 PDF 스트리밍 뷰어 '스트림닥스(StreamDocs)'와 PDF 변환 솔루션 '피디에프 게이트웨이(PDF Gateway)'의 부가기능으로 제공한다고 18일 밝혔다.
이파피루스 자체 개발 모듈인 '블랙마커'는 PDF 문서에 포함된 민감정보를 찾아내고 마스킹(Masking) 처리한 후, 원본 데이터를 삭제하여 정보 유출 위험을 원천 차단한다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.


문서 AI 기업 이파피루스(대표 김정희)는 민감정보 비식별화 모듈 '블랙마커(BlackMarker)'의 성능을 업그레이드, 대표 제품인 PDF 스트리밍 뷰어 '스트림닥스(StreamDocs)'와 PDF 변환 솔루션 '피디에프 게이트웨이(PDF Gateway)'의 부가기능으로 제공한다고 18일 밝혔다.
이파피루스 자체 개발 모듈인 '블랙마커'는 PDF 문서에 포함된 민감정보를 찾아내고 마스킹(Masking) 처리한 후, 원본 데이터를 삭제하여 정보 유출 위험을 원천 차단한다. 이번 업그레이드를 통해 기존의 전화번호, 주민등록번호, 이메일과 같이 일정한 형식을 갖춘 정형화된 데이터는 물론, 인명이나 주소와 같은 비정형 개인정보도 자동으로 감지하여 일괄 비식별 처리할 수 있게 됐다.
이러한 성능 향상의 비결은 방대한 인명과 지명 데이터베이스를 기반으로 업그레이드한 비식별화 모델 덕분. 새로워진 '블랙마커'의 비식별화 모델은 규칙 기반 모델과 사전 기반 모델로 구성돼 있다. 문서를 업로드하면 텍스트 전처리 과정을 거친 후, 두 모델이 각각 문서 내에 포함된 정형·비정형 개인정보를 인식하여 비식별화한다.
커스텀 기능과 효율적인 문서 처리 방식도 눈에 띈다. '블랙마커'는 마스킹 처리된 부분에 원하는 텍스트나 특수문자가 표시되도록 설정하는 커스텀 기능을 지원한다. 서버 기반 자동 배치 처리 방식을 적용하여 대량의 문서도 빠르고 안정적으로 비식별화한다.
김정아 이파피루스 부사장은 “AI를 활용한 비식별화 솔루션의 경우 기존 방식보다는 정확도가 높지만 고가의 GPU 서버 환경을 요구하기 때문에 고객 입장에서는 도입 비용 부담이 크다”라면서 “이파피루스 '블랙마커'는 메인보드에 내장된 일반적인 수준의 GPU를 그대로 사용하면서도 AI 비식별화 수준의 정확도를 구현, 비용 절감과 정보 보호 강화를 동시에 실현할 수 있다”고 전했다.
PDF 뷰어 '스트림닥스'에서 '블랙마커' 기능을 사용하면 문서를 업로드한 후 뷰어 내에서 직접 텍스트를 검색하거나 영역을 지정하여 마스킹 처리하거나, 이름 및 주소, 전화번호와 주민번호 등을 일괄 비식별화할 수 있다. 보안 처리된 문서는 파일 다운로드 없이 웹 브라우저에서 바로 열람할 수 있는 링크를 통해 공유할 수 있어 더욱 안전하고 편리하다.
PDF 변환 솔루션 '피디에프 게이트웨이'에서 사용할 경우 한글, MS오피스, 기타 다양한 포맷의 문서를 PDF 문서로 변환하면서 동시에 민감정보를 비식별화할 수 있다. API 커스텀을 통해 기관명이나 명사, 정규식 등 특정 데이터를 자동으로 마스킹 처리하는 것도 가능하다.
김정희 기자 jhakim@etnews.com
Copyright © 전자신문. 무단전재 및 재배포 금지.
- 하반기 신차 2대 중 1대는 '전기차'…캐즘 돌파 승부수
- 당정, 민생지원금 '전 국민' 지급 결정…세입경정 절차도 돌입
- 엔비디아가 투자한 휴머노이드의 '눈' LG이노텍이 만든다
- “소재평가부터 화재시험까지”…K-배터리 분석 기지 KETI 오창 센터
- [바이오 USA]글로벌 위상 과시한 K바이오, 세계 관심 한눈에
- [바이오 USA]CDMO 성장 자신한 존림 삼성바이오 대표 “증설·신사업 진출로 성장동력 확보”
- 네이버, 통합 AI 에이전트 핵심 추론모델 공개 임박…데이터 연동해 구글과 차별화
- 용산구, IoT 종량제 봉투 자판기 확대 도입…공급자 중심에서 소비자 눈높이 전환
- 카카오헬스 '파스타', 스트레스·수면까지 담는다…초정밀 건강관리 구현
- 李대통령, G7서 9개국 정상과 회담…외교 무대서 韓 복귀 알려