[데이터] '변화무쌍' 날씨 빅데이터..AI로 콕 잡았다

신찬옥 2021. 1. 27. 04:06
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

돈 되는 날씨정보
오류 줄이는 인공지능
기상데이터 하루 52테라 생산
130종 가공자료 누구나 무료로
기상청, AI 도입해 정확도 개선
관측장비 오작동·통신 이상 등
인공지능 오류패턴 학습시키자
오류탐지율 기존대비 70%올라

에코브레인은 기상 정보를 재가공해 다양한 산업군에 '맞춤 솔루션' 서비스를 제공하는 회사다. 날씨 영향을 많이 받는 전력산업 발전사업자들의 수익을 극대화할 방법을 제시하고, 도심에 큰 고층 건물이 들어서면 빌딩 바람이 어떻게 달라지는지, 도보 환경은 어떻게 변하는지 시뮬레이션해주기도 한다. 비용은 사업 규모에 따라 다르지만 1억원에서 18억원까지 다양하다.

2009년 에코브레인을 창업한 이영미 대표는 "최신 데이터 마이닝 기술과 고객 현장 데이터를 통해 맞춤형 정보를 제공하지만, 가장 기본이 되는 기상청 데이터가 맞지 않으면 아무리 잘 분석해도 한계가 있다"면서 "사업자로서 봤을 때 기상청에서 제공하는 기상 정보의 질은 매우 높은 수준이다. 최근 몇 년간 공공데이터 오픈 정책 덕을 많이 봤다"고 말했다.

풍력·태양광 등 재생에너지 발전량 예측 솔루션. [사진 제공 = 에코브레인]
정부가 '데이터 경제'를 표방하며 데이터 활용을 장려하고 있는 가운데 '돈이 되는 기상 데이터'에도 관심이 쏠린다. 기상 데이터는 실생활과 밀접하게 관련돼 있는 데다 '개인정보' 등 이슈에서도 자유로워 활용하기 쉽다. 기상 데이터를 활용하려는 기업은 기상청과 계약을 맺고 통신망 비용 정도만 지불하면 데이터를 사실상 무료로 활용할 수 있다. 최근 몇 년 새 기상 정보 활용 기업이 많이 생겨난 이유도 여기에 있다.

전국에서 매일 수집되는 기상 관측 데이터는 얼마나 될까. 기상청이 하루 생산하는 데이터는 약 52테라바이트(TB)로, 초고화질(4MB) DVD 영화 1만3000편을 내려받을 수 있는 양이다. 이 데이터는 1차 가공을 거쳐 '기상자료개방포털'을 통해 무료로 공개된다. 현재 개방된 데이터는 지상·해양·고층·항공 관측, 기상위성, 기상레이더, 기상지수 등 130종이나 된다. 개인이나 기업·기관 누구나 무료로 활용할 수 있다.

기상청 관계자는 "개인이 많이 이용하는 '동네예보정보조회서비스'는 행정안전부 공공데이터 포털(data.go.kr) 인기 데이터 순위 1위(누적 기준)"라며 "공공 데이터 포털에 39종 기상 데이터를 공개하고 있는데, 작년 한 해 조회(호출) 건수는 33억7000만건에 달한다"고 설명했다.

제주 날씨에 따라 맞춤 관광 정보를 제공하는 `웨더플레이스` 모바일 앱 화면. [사진 제공 = 에코브레인]
기상 데이터의 생명은 '정확성'이다. 기상청은 2019년부터 작년까지 날씨 빅데이터에 인공지능(AI)을 접목해 정확도를 높였다. 기존 품질 검사에서 찾아내지 못했던 '잠재적 오류 데이터'까지 탐지할 수 있는 기술을 적용한 것이다. 기상청에 따르면 이 같은 데이터 플래그십 사업으로 '오류 탐지 개선율'이 70%나 향상됐다. 기존 0.12%였던 오류 탐지율이 0.21%로 오른 것이다.

슈퍼컴퓨터와 전국 4000개 수집 장비를 활용하는데도 날씨를 예측하기 어려운 것은 날씨가 기본적으로 '물리적 현상'이기 때문이다. 게다가 정확하게 관측하기 어려워 자동으로 감지할 수 없는 오류도 있었다.

예를 들어 강수량은 새벽이슬이 누적 강수로 감지되거나 통신 이상으로 누적 강수량이 축소 기록되는 오류를 자동으로 탐지하기 어려웠다. 바람 방향이나 속도 역시 일주일에서 한 달간 유사한 방향의 풍향만 감지될 때는 오류가 생기기 쉬웠다.

기상청은 기존 데이터의 오류 패턴을 인위적으로 만들어 AI에 학습시키고 지상 관측, 위성 영상, 레이더 영상 같은 이종 데이터를 융합해 연관성을 분석하는 등 다양한 방법으로 데이터 정확도를 높였다.

앞으로 활용도도 높아질 전망이다. 기상청은 현재 기상청에서 소관하는 약 700개소 관측 데이터만 제공할 수 있는 민원 서비스(기상현상증명)를 3400개 공공기관 소관 데이터까지 단계적으로 확대할 방침이라고 밝혔다. 기상현상증명이란 법원, 경찰서, 보험사, 관공서 등에 제출할 수 있도록 특정일의 기상 현상이 어떠했는지 기상청이 발급해주는 증명서다. 예컨대 담장 설치로 인한 침수 사고 관련 소송 당사자가 해당 지역의 시간별 강수량 데이터를 요청해 받을 수 있다.

기상청 관계자는 "현재 26개 공공기관의 기상 관측 데이터도 방재 등 목적으로 공동 활용하기 위해 기상청이 실시간 수집해 통합 관리하고 있다"면서 "전국 4000개 지점에서 1분 단위 기온과 강수량, 풍향·풍속, 기압 등 관측 자료를 실시간으로 수집하고 있으며 기상 데이터 정확도를 높이기 위해 끊임없이 연구하고 있다"고 말했다.

[신찬옥 기자]

[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?