AI 기상예보 모델 '터닝포인트' 도달했다…'눈부신 발전'
전망 과정 몰라 '신뢰' 한계…'전례 없는 현상' 예측할 수 있을까
(서울=연합뉴스) 이재영 기자 = 작년 마이크로소프트(MS) 운영체제 윈도에서 제공하는 일기예보에 7월 중 사흘을 제외하곤 모두 비가 내린다고 제시돼 기상청이 '신뢰성이 떨어진다'라고 해명하는 해프닝이 있었다.
현재 과학기술론 향후 열흘 정도의 날씨를 예측하는 것이 한계로 한 달 치 예측은 신뢰하기 어렵다는 것이 기상청 설명이었다.
실제 작년 7월 전국 평균 강수일은 17.7일로 장마철이었던 만큼 비가 자주 내리긴 했지만, 사흘 빼고 비가 온 수준은 아니었다.
'사실상 7월 한 달 내내 비'라는 엉뚱한 예보는 '과거 관측치 평균', 즉 통계를 예보처럼 보여주면서 발생한 일로 알려졌다.
14일 학계에 따르면 1년이 지난 현재, 과거 자료를 딥러닝으로 학습한 빅테크들의 인공지능(AI) 기상예보 모델이 기존 수치예보 모델보다 나은 정확도를 보이면서 기상청도 이를 참고하는 단계에 이르렀다.
AI 기상예보 모델 관련 논문에서는 '터닝포인트'에 도달했다는 표현이 심심치 않게 등장하고 있다.
현존 최고 수치예보모델 뛰어넘은 AI 모델 최소 7개
현재 예보는 수치예보모델에 기반한다.
'슈퍼컴퓨터로 날씨를 예측한다'라고 표현하는 경우가 많지만, 슈퍼컴퓨터는 수치예보 모델을 운용하기 위한 하드웨어에 불과하다.
수치예보 모델은 일종의 '날씨 시뮬레이터'로, 대기 중 유체의 움직임을 기술한 방정식을 풀어 미래의 상태를 예측하며 기본적으로 과거 통계를 반영하지 않는다.
현재 예측 정확도가 가장 높은 모델로 '유럽중기예보센터 통합예측모델'(ECMWF IFS)이 꼽힌다. 한국은 세계 9번째 독자 수치예보모델 보유국인데 한국형 수치예보모델(KIM) 성능은 세계 1~3위 모델의 88% 수준으로 평가된다. 다만 한반도로 오는 태풍 경로 예측 등에서는 더 나은 성능을 보여주기도 한다.
AI 기상예보 모델들은 최근 2년 사이 눈부시게 발전했다.
2022년 이후 최소 7개 연구팀이 ECMWF의 단일예측(deterministic forecast)에 견줘 정확도가 높은 전망을 생산하는 AI 모델을 개발했다고 밝혔다.
단연 앞선 모델은 구글 딥마인드 '그래프캐스트'(GraphCast)와 중국 화웨이 클라우드의 '판구-웨더'(Pangu-Weather)이다.
화웨이 모델, 2018년 태풍 콩레이 예측서 수치모델 앞서
딥마인드 측 논문에 따르면 그래프캐스트는 10일 예측에서 ECMWF IFS 고해상도(HRES) 모델과 비교해 1천380개 변수와 기압 전망치 중 90.3%에서 평균제곱근오차(RMSE)가 작았다. RMSE는 예보모델 정확도를 평가하는 지표로 작을수록 예측이 정확했다는 의미다.
특히 대기 최상층인 50hPa(헥토파스칼) 지점을 빼면 전망이 이뤄진 항목 중 96.9%에서 그래프캐스트의 정확도가 더 높았다. 100hPa 지점까지 제외하면 99.7% 항목에서 그래프캐스트가 ECMWF IFS HRES보다 정확했다.
판구-웨더는 '사상 처음' ECMWF IFS보다 성능이 뛰어난 AI 모델로 화웨이 측이 2022년 발표한 논문에서 자평했다.
화웨이 측은 기온, 풍속, 지위고도 등 모든 항목과 모든 선행시간에서 판구-웨더가 ECMWF IFS HRES보다 뛰어났으며 '향후 1시간에서 일주일까지' 예측에서 특히 앞섰다고 설명했다.
판구-웨더와 관련해 특히 눈길을 끄는 부분은 태풍 경로 예측이다.
2018년 국내에 상륙해 피해를 일으킨 태풍 '콩레이'의 경로를 예측시킨 결과 판구-웨더는 실제 경로와 거의 비슷한 전망을 내놨다. ECMWF IFS HRES는 애초 콩레이가 중국에 상륙한다고 전망했다가 판구-웨더보다 48시간 이상 늦게 판구-웨더처럼 중국에 상륙하지 않는다는 전망을 제시했다.
개발자의 '자평'뿐 아니라 독립 연구자들의 평가에서도 AI 모델이 ECMWF IFS HRES보다 성능이 준수하다는 결과가 나오고 있다.
스웨덴 웁살라대 연구진은 최근 유럽지구과학협회(EGU) 홈페이지에 공개한 논문에서 "고도 2m 지점 기온과 10m 지점 풍속에 초점을 맞춰 그래프캐스트·판구-웨더와 ECMWF IFS HRES 단일예측을 비교한 결과 모든 선행시간과 지역에서 AI 모델이 ECMWF IFS HRES보다 나았다"라고 밝혔다.
다만 웁살라대 연구진은 "육상예보는 ECMWF IFS HRES가 일반적으로 더 성능이 뛰어났다"라면서 "동아시아와 북미의 폭염 등 인구밀집지 극한 기상현상을 반복 예측하는 데는 ECMWF IFS HRES가 여전히 최고였다"라고 설명했다.
열흘 전망을 1분 내…비용은 10원 정도
사실 현재 기상당국이 꼽는 AI 모델 최대 장점은 정확도보단 비용과 시간이다.
전망치를 '맘껏' 생산해 예보에 반영할 수 있다는 것이다.
그래프캐스트는 1979년부터 2017년까지 ECMWF ERA5 재분석 자료를 학습했다. ECMWF ERA5 재분석 자료는 ECMWF 모델의 분석과 실제 관측값이 더해진, 날씨에 관한 인류가 파악한 최대치의 참값이라고 할 수 있다.
32기의 구글 클라우드 TPU v4가 동원된 그래프캐스트의 자료 학습 기간은 고작 4주에 불과했다.
판구-웨더는 엔비디아 V100 GPU 192대로 ECMWF ERA5 재분석 자료 37년 치를 약 보름간 학습해 만들어졌다.
두 모델 모두 한 달도 안 되는 기간에 30여년간 날씨를 익힌 뒤 현존하는 최고 성능 수치예보모델보다 낫거나 버금가는 예보를 내놓은 셈이다.
그래프캐스트는 TPU v4 1대로 1분 내, 판구-웨더는 V100 GPU 1대만 있으면 '수초 내' 전망을 내놓을 수 있다고 한다.
그래프캐스트의 경우 전 지구를 103만8천240개 격자로 나눠 기온과 기압 등 227개 항목에 대해 10일 치 전망을 내놓는 데 1분이 안 걸린다고 딥마인드는 밝혔다.
비용면에서는 AI 모델이 압도적이다.
ECMWF 자료에 따르면 ECMWF IFS HRES는 한 번 전망치를 내놓는데 90달러(약 12만원)가 들지만 판구-웨더는 1센트도 들지 않는다. 10원 정도가 든다는 얘기다.
복잡한 방정식을 푸느라 한 번 예측하는데 많은 시간과 비용이 들어 '초단기' 예측이 어려운 수치예보모델 단점을 AI 모델이 보완할 수 있는 구조다.
그래프캐스트는 소스코드가 공개돼 누구나 집에서 구동해볼 수 있다.
기상청도 AI 모델 활용…한계도 존재
현재 기상청은 그래프캐스트와 판구-웨더, MS의 클라이맥스(ClimaX) 등에 한국형 수치예보모델 분석자료를 반영해 산출한 전망치를 중기예보 시 참고하고 있다.
임윤진 기상청 재해기상대응팀장은 "수치예보 모델은 가끔 좀 '튀는' 전망을 내놓고는 하는데 과거 자료를 학습해 패턴을 익힌 AI 모델들은 대체로 일관된 전망을 보여준다"라면서 "향후 3~6일 정도 전망 시 꽤 유의미한 정보를 제공해주고 있다"라고 말했다.
다만 AI 모델이 수치예보 모델 앙상블 예측모델보다는 아직 성능이 좋지는 못하고 '중규모 현상'을 놓칠 때가 있다고 임 팀장은 덧붙였다.
앙상블 예측은 초기 조건을 달리해 산출한 여러 예측을 종합해 예측성을 향상하는 기법이다.
AI 모델의 한계도 분명히 존재한다.
첫째로 우려되는 점은 AI 모델이 전망을 내놓는 과정을 인간이 알 수 없는 '블랙박스' 문제이다.
어떤 근거로 전망을 내놨는지 모른다면 인간의 머리로는 예상하기 어려운 전망을 AI 모델이 내놨을 때 이를 믿어야 할지 말아야 할지 결정하기 어렵다.
연구자들은 '설명할 수 있는 AI 개발'로 이런 문제를 돌파하려고 한다.
기후변화로 전례 없는 기상현상이 나타나는 점도 AI 모델에 전적으로 의존하기 어렵게 하는 점이다.
지난 2022년 8월 중부지방에 시간당 100㎜가 넘는 집중호우가 쏟아졌을 때 기상청 예보관들이 집단으로 사의를 표한 적 있다. 자신들의 경험이 앞으로 날씨를 예보하는 데 방해가 될 수 있다는 판단에서다.
과거 자료를 학습한 AI 모델도 '과거에 발생한 적 없는 현상'을 예상하는 데 한계를 보일 수 있다.
jylee24@yna.co.kr
▶제보는 카톡 okjebo
Copyright © 연합뉴스. 무단전재 -재배포, AI 학습 및 활용 금지
- 머스크, '정부효율부' 구인 나서…"IQ 높고 주80시간+ 무보수" | 연합뉴스
- [사람들] '요리예능' 원조 "수백만원짜리 코스라니? 셰프는 겸손해야" | 연합뉴스
- "우리집에 가자"…초등생 유인하려던 50대 '코드0' 발령해 체포 | 연합뉴스
- "콜택시냐"…수험표까지 수송하는 경찰에 내부 와글와글 | 연합뉴스
- '앙투아네트 스캔들 연관설' 다이아 목걸이 67억원 낙찰 | 연합뉴스
- '마약 자수' 김나정, 필리핀서 귀국 직후 양성반응…경찰 조사(종합) | 연합뉴스
- 영동서 50대 남녀 흉기 찔려 숨져…"살해 뒤 극단선택한 듯"(종합) | 연합뉴스
- '동생살인' 60대, 법정서 부실수사 형사에 돌연 "감사합니다" | 연합뉴스
- [수능] 국어지문 링크에 尹퇴진집회 안내…경찰 "해킹아닌 도메인 구입"(종합2보) | 연합뉴스
- 이영애, '김여사 연관설' 제기 유튜버 화해거부…'끝까지 간다' | 연합뉴스