AI로 마스크, 갈치, 분유 온라인물가를 파악한다고? 어떻게 가능할까

나상현 2021. 2. 11. 15:01
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

코로나19 팬데믹(세계 대유행)으로 대면 소비가 줄어들면서 온라인쇼핑을 통한 비대면 소비가 확연히 늘어나고 있다.

통계청은 인공지능(AI)을 통해 온라인 물가를 빠르고 쉽게, 그리고 정확하게 파악하는 작업에 첫발을 떼고 있다.

통계청 측도 "일부 품목에 대해 AI 기술을 활용해 온라인 가격 수집·정제 방법에 대한 연구용역을 진행했으나, 이번 연구에 AI를 활용한 온라인물가지수 작성 내용은 포함돼 있지 않다"면서 "(온라인물가지수) 관련 구체적인 계획은 아직 없다"고 선을 그었다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[서울신문]통계청, AI활용 온라인가격 수집 연구용역
온라인쇼핑 발달로 체감과 물가지수 괴리성
AI 통해 온라인 빅데이터를 정제해 물가 제공
아직은 초기 연구…“추가적인 심화연구 필요”

코로나19 팬데믹(세계 대유행)으로 대면 소비가 줄어들면서 온라인쇼핑을 통한 비대면 소비가 확연히 늘어나고 있다. 실제로 통계청에 따르면 지난해 온라인쇼핑 거래액은 161조 1000억원으로 전년 대비 19.1% 급증했다. 이에 따라 물가도 마트나 시장 등 오프라인뿐만 아니라 온라인에서 파악하는 비중도 높여야 하는 것 아니냐는 목소리가 나오고 있다. 통계청은 인공지능(AI)을 통해 온라인 물가를 빠르고 쉽게, 그리고 정확하게 파악하는 작업에 첫발을 떼고 있다.

사진은 비말 차단용 마스크(왼쪽) 샘플과 KF94 마스크(오른쪽)의 모습. 연합뉴스

11일 통계청이 최근 연구용역을 맡긴 ‘AI활용 온라인가격 수집·정제방법에 대한 연구’ 보고서에 따르면 온라인 시장의 성장으로 기존의 오프리안 시장 중심 소비자물가지수의 현실성은 상대적으로 저하되고 있다. 특히 보고서는 기존 소비자물가지수가 월별로 작성되고, 대표 상품 위주로 구성돼 있어 소비자들의 다양한 소비 패턴에 따른 많은 상품의 가격변화를 반영할 수 없는 한계가 존재한다고 밝혔다.

대표적으로 소비자물가지수는 상품 및 서비스 등 152개 품목을 대표상품으로 지정해 조사하지만, 정작 코로나19 확산에 따른 수요 증가로 국민적 관심이 모아진 마스크는 물가 조사 대상에 포함이 돼 있지 않았다. 마스크 가격동향은 물가조사와는 별도로 제공되고 있다. 온라인 중심으로 소비행태가 옮겨지고, 전 세계적 전염병이라는 특수 상황 속에서 괴리가 발생할 수 있다.

이 때문에 온라인물가지수가 주목을 받는다. 웹페이지의 HTML을 수집하는 기술인 ‘웹 스크랩핑’(web scraping)을 이용하면 온라인 쇼핑 웹사이트에 제시된 모든 상품의 가격을 수집해 작성할 수 있다. 문제는 온라인을 통해 수집하는 정보는 대용량인데다 정제돼 있지 않아 혼선을 일으킬 수 있다는 점이다. 예컨대 같은 마스크라도 KF94나 KF80 등 국민이 필요한 마스크가 있고, 개 마스크나 마스크 걸이, 의료용 코 마스크 등 상대적으로 관심이 떨어지는 마스크가 있을 수 있다. ‘마스크’라는 키워드만으로 정보를 수집하면 불필요한 정보가 섞이거나, 정작 필요한 정보는 제외될 우려가 있는 것이다.

여기서 인공지능, AI가 등장한다.

보고서에서 실제로 프로토타입을 설계해 활용한 결과에 따르면 우선 ‘마스크’ 검색어를 통해 관련 온라인 쇼핑 빅데이터를 수집한다. 이후 AI가 텍스트를 제외하고 상품명에 포함된 불필요한 단어나 특수기기 등을 제거하는 작업을 거친다. 예를 들어 온라인쇼핑몰에 ‘KF94 마스크 1매 특가+ 세정제 1개!’와 같은 제목으로 올라와 있다면 ‘+’나 ‘!’ 같은 특수기호는 물론이고 ‘KF94 마스크’라는 정보를 제외한 불필요한 단어도 제거해 정형화하는 것이다. 또한 개수, 용량, 무게, 봉 등 물가지수 산출을 위한 숫자도 산출하고, 묶음상품인지 여부도 확인한다. 이렇게 KF94와 KF80 마스크에 해당하는 물가 정보만 정확히 추출해 제공될 수 있다. 농축수산물 등 다른 품목도 같은 원리로 추출이 가능하다.

‘AI활용 온라인가격 수집·정제방법에 대한 연구’ 보고서. 통계청 제공.

그러나 보고서는 실제 구현까지는 아직 추가 연구가 필요한 상황이라고 강조했다. 또한 이번 연구는 작업별 적용에 집중했던 만큼 통합적 측면에서 적용하는 아이디어도 필요하다고 밝혔다. 통계청 측도 “일부 품목에 대해 AI 기술을 활용해 온라인 가격 수집·정제 방법에 대한 연구용역을 진행했으나, 이번 연구에 AI를 활용한 온라인물가지수 작성 내용은 포함돼 있지 않다”면서 “(온라인물가지수) 관련 구체적인 계획은 아직 없다”고 선을 그었다.

다만 관련 논의가 첫발을 내디딘 만큼 수년 내에 온라인물가지수를 통해 보다 현실적인 물가동향을 받아보길 기대할 수 있어 보인다.

세종 나상현 기자 greentea@seoul.co.kr

▶ 밀리터리 인사이드 - 저작권자 ⓒ 서울신문사 -

Copyright © 서울신문. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?