돌발상황 대응 못하는 AI 예보관.. 인간과 '상호보완' 필요 [연중기획-지구의 미래]
환경과학원 '대기질 예보 모델' 사용
자료 토대로 하루에 4번 농도 안내
실시간 배출량 반영 못해 약점 지적
과거 패턴 분석한 AI 정확도 높지만
2020년 코로나 변수에 '오보' 쏟아내
인간 직관·경험 바탕 '보조지표' 활용
◆AI의 널뛰기, 기존 패턴대로라면 ‘백전백승’
31일 국립환경과학원에 따르면 예보관들은 AI 기술이 접목된 예보모델을 참고하고 있다. 국립환경과학원이 참고하는 AI모델 중 하나는 허창회 서울대 지구환경과학 교수팀이 개발한 시스템이다. 지난해부터 시범 도입했다.
현재 국립환경과학원은 대기질 예보(CMAQ)모델을 주로 사용한다. 현재 국립환경과학원이 하루에 네 번(5시, 11시, 17시, 23시) 안내하는 미세먼지 농도도 주로 이 모델을 근거로 한다. 기상조건, 오염물 배출 등 관측치를 토대로 이후 대기질을 예보하는 이 모델은 하지만 실시간 배출량을 반영하지 못하고 관측값의 대표성이 떨어지는 등 정확성을 보장할 수 없다는 약점이 지적돼 왔다. 2018년 기준 하루 예측 정확도가 73%, 이틀 예측 정확도는 68%에 그치는 수준이었다.
하지만 신종 코로나바이러스 감염증(코로나19)이 휩쓴 지난해 지구는 AI가 보기에도 이상했던 걸까. 지난해 예보는 정확도가 크게 떨어지는 모습이 나타났다. AI는 기존 학습 내용에 따라 지난해도 미세먼지가 나쁠 것이란 결과를 내놓았다. 과거와 비슷한 대기순환 조건임을 고려하면 지난해 미세먼지 농도가 짙었어야 하지만 실제로는 훨씬 좋았던 것이다.
연구진에게 지난해 오보의 정확한 원인은 아직 미스터리다. 허 교수는 “중국 오염원 배출량이나 국내 배출량 모두 당장 자료를 구할 수 없어 정확한 원인 분석이 어렵다”면서도 “지난해 코로나19 같은 돌발상황에 발생하는 극단적인 현상은 AI가 맞히지 못하는 것”이라고 설명했다.
◆답만 써놓는 AI, 풀이과정을 내놓아라
지난해 ‘돌발상황’에 전혀 대응하지 못한 AI. 여기서 AI의 맹점이 드러난다. 이 새 모델은 익숙한 환경에서는 100%에 가까운 정확도를 뽐낼 수 있어도 조금이라도 환경이 바뀌면 융통성을 발휘하지 못한다. AI는 정해진 알고리즘대로, 이미 짜인 일련의 과정에 따라 움직인다. 여러 정보를 흡수하면 비슷한 정보끼리 경향성을 발견하거나 평균을 어림잡을 수 있는 인간의 사고방식과 전혀 다르다. AI에는 그저 각각이 개별 정보일 뿐이다.
처음 학습된 대로만, ‘이런 상황에서는 과거에 이랬으니 이번에도 이래야 한다’고 원칙적으로만 사고하는 유형에 가까운 AI 입장에서 지난해 같은 돌발변수는 예측 정확도를 높이는 데 걸림돌이다. 허 교수는 “지난해 데이터를 포함하면 올해 예측성이 오히려 낮아졌다”며 “비정상적인 상황을 학습하고 나니 이후 예측 결과가 영향을 받아 지난해 수치는 아예 학습시키지 않으려 한다”고 설명했다.
이런 특징 때문에 서울의 미세먼지를 완벽하게 예측하는 AI라도 부산에서는 오답만 뱉어내는 기계로 전락할 수 있다. 난방 등으로 오염원 배출이 많아지는 겨울철, 온도가 오르면 대기가 정체돼 미세먼지 농도가 높아지기 쉽다. 그러나 이건 경향성일 뿐 지역별 바람·습도에 따라, 시간에 따라 실제 관측값은 다 다르다. 정확한 예보를 위해서는 지역별로 모든 정보를 처음부터 학습시켜 ‘지역 맞춤형’ AI 예보모델을 만들어야 한다.
AI 계산 과정을 알아내는 것도 숙제다. 과거 자료를 흡수한 AI는 알고리즘에 따라 입력된 자료를 이리저리 계산해 최종 예보만 내놓을 뿐 산출 과정은 알려주지 않는다. 이를 보는 예보관들의 심정은 말 없는 학생이 수학문제를 아무 풀이과정 없이 답만 적어놓은 것을 본 선생님의 마음 같아진다. 답을 맞혔으면 어떻게 맞혔는지, 틀렸으면 처음에 식부터 틀렸는지 마지막 계산에서 실수가 있었는지 알 방법이 없어 ‘오답노트’가 불가능하기 때문이다.
허 교수는 AI에 ‘대기과학 문제를 푸는 통계도구’ 이상의 의미를 부여하지 않는다. 미세먼지 예측은 일기 예측에 더해 인간이 내뿜은 오염물질 배출까지 함께 계산해야 한다. 이중으로 불확실성이 커 훌륭한 가르침을 받은 AI라도 혼자 예보하기는 무리다. 바꿔 말해 AI 기술이 고도화한다 해도 인간 예보관의 일자리까지 차지할 수는 없을 것으로 보인다.
국립환경과학원 관계자는 “예보관이 미세먼지 등급(좋음·보통·나쁨·매우 나쁨) 등을 결정할 때 여러 모델을 참고하는데, AI모델이 예측한 결과도 그중 하나가 되는 정도”라며 “‘나쁨’ 등급 이상일 때 기존 수치모델에 비해 고농도 예보 정확도가 향상됐다는 결과를 확인했지만, 아직 계절별 특성 등 모델 특징을 파악하는 중”이라고 말했다.
박유빈 기자 yb@segye.com
Copyright © 세계일보. 무단전재 및 재배포 금지.
- 제자와 외도한 아내 ‘사망’…남편 “변명 한마디 없이 떠나”
- 백혈병 아내 떠나보내고 유서 남긴 30대...새내기 경찰이 극적 구조
- "北남녀 고교생, 목욕탕서 집단 성관계" 마약까지...북한 주민들 충격
- “배현진과 약혼한 사이" SNS에 올린 남성, 재판서 혐의 인정
- “영웅아, 꼭 지금 공연해야겠니…호중이 위약금 보태라”
- 미성년 남학생과 술 마시고 성관계한 여교사 되레 ‘무고’
- 술 취해 발가벗고 잠든 여친 동영상 촬영한 군인 [사건수첩]
- “내 친구랑도 했길래” 성폭행 무고한 20대女, ‘녹음파일’ 증거로 덜미
- 사랑 나눈 후 바로 이불 빨래…여친 결벽증 때문에 고민이라는 남성의 사연
- "오피스 남편이 어때서"…男동료와 술·영화 즐긴 아내 '당당'