"경제기사 데이터로 썼더니, 경기 예측 정확도 높아져"

이윤주 기자 2022. 5. 16. 15:45
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[경향신문]

뉴스 텍스트 기반 경제지표 작성 예시. 한국은행 제공

경제 기사를 데이터로 활용해 경제 지표를 만들었더니, 전망의 변화를 실시간으로 잘 포착해 공식 통계에 선행하고 예측의 정확도도 높아지는 것으로 분석됐다.

한국은행 경제통계국 통계연구반 서범석 과장은 16일 ‘뉴스텍스트를 이용한 경기 예측: 경제 부문별 텍스트 지표의 작성과 활용’ 보고서에서 2005년 1월부터 2022년 3월까지 인터넷 포털사이트에 게재된 기사 100만건(연평균)을 분석해보니 이같이 나타났다고 밝혔다.

예를 들어 주가전망 텍스트 지표의 경우 ‘코스피’, ‘상승’과 같은 특정 단어를 포함하는 문장이 등장하는 기사를 추출하고 이들 기사가 전체에서 차지하는 비중을 계산하는 방식이다. 생산, 물가, 고용, 주택가격 등 15개 부문에 단어군을 선정해 각각의 경제지표를 산출했다.

보고서에 따르면 이렇게 작성된 뉴스 텍스트 기반 경제지표를 기존 예측모형에 추가하면 ‘국내총생산(GDP) 전년동기대비 증가율 예측’ 평균오차는 기존 0.743에서 0.681로 낮아졌다. 예측 정확도가 향상됐다는 뜻이다. 서 과장은 “텍스트 지표는 조사대상 기준일에 즉시 작성 가능해 주로 익월 중순 이후 발표되는 공식 통계보다 입수 시점이 빠르다”면서 “전문가의 전망 등을 반영해 통계적으로 선행성을 갖기 때문에 GDP 예측력 향상에 기여한 것으로 판단된다”라고 말했다.

코로나19 영향이 컸던 2020년 6월 말을 살펴보면 텍스트 지표를 공식 통계에 추가한 경우 2020년 2분기 GDP 예측치가 실제에 더 근접하고, 경제 변수들의 변화를 더 잘 포착했다고 설명했다.

또 작성한 텍스트 지표 대부분은 공식 통계와 높은 상관관계를 보였으며, 0∼9개월 선행하는 것으로도 나타났다. 서 과장은 “기존 정량적 통계 모형만으로는 신속한 경기 예측이 어렵다. 보통 대상 시점과 공표 시점이 달라 한 달 이상 지연이 발생하기 때문”이라며 “그래서 최근 많은 연구가 뉴스텍스트 빅데이터의 중요성을 강조하고 있다”라고 말했다. 그는 “뉴스 텍스트는 다양한 전문가의 견해와 전망 등 정성적 정보를 포함하고 있고 실시간으로 입수할 수 있기 때문에 이를 종합하고 정량화해 경기 예측에 활용할 필요가 있다”고 덧붙였다.

이윤주 기자 runyj@kyunghyang.com

Copyright © 경향신문. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?