인공지능, 산업현장 적용 왜 어려울까?

한겨레 2021. 10. 4. 18:06
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

2016년 3월에 개최된 알파고와 이세돌의 바둑 대결은 인공지능(AI) 연구에서 획기적인 사건이었다.

연구단계에서 좋은 성능을 보인 인공지능이라 하더라도 산업 현장에 그대로 적용하기에는 무리가 따른다는 이야기다.

하지만 인공지능을 산업 현장에 적용하기 위한 요건의 중심엔 데이터가 있다.

도메인 지식과 현장의 데이터가 중심이 된 적용 성공 사례가 많아질 때, 기술과 시장의 상호작용이 활발하게 이루어져 제대로 된 인공지능 생태계가 만들어질 수 있다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

인공지능. 게티이미지뱅크

[왜냐면] 김영재ㅣ카이스트 기술경영전문대학원 석사과정

2016년 3월에 개최된 알파고와 이세돌의 바둑 대결은 인공지능(AI) 연구에서 획기적인 사건이었다. 대국 전에 대부분의 참관인들은 이세돌이 알파고를 이길 것으로 기대했다. 하지만 5차례의 대국에서 알파고는 이세돌을 4 대 1로 이겼다.

그 뒤 딥러닝과 강화학습은 인공지능의 부흥을 이끌었고, 수조원의 투자로 이어졌다. 올해 정부는 인공지능 관련 분야에 2조원이 넘는 예산을 투입하고 있다. 그러나 가트너(Gartner)와 벤처비트(VentureBeat)의 보고서를 보면, 80% 이상의 인공지능 프로젝트는 실패했다고 한다. 연구단계에서 좋은 성능을 보인 인공지능이라 하더라도 산업 현장에 그대로 적용하기에는 무리가 따른다는 이야기다.

세가지 이유가 있다. 첫째는 학습 데이터의 부족이다. 여러 인공지능 학습 방법 중 지도학습이 가장 강력한 성능을 가진다. 지도학습의 데이터는 입력 데이터와 출력 데이터의 쌍으로 구성된다. 이러한 학습 데이터의 양이 인공지능 성능에 큰 영향을 미친다. 하지만 학습 데이터 구축이 쉽지 않다. 예를 들어 의료 영상 이미지 학습 데이터를 구축한다고 하자. 이를 위해서는 고도로 전문화된 의사가 많은 양의 의료 영상 이미지를 분석하여 진단(레이블)을 작성해야 한다. 그 비용과 노력은 만만치 않다. 그렇기에 레이블을 최대한 쉽게 작성할 수 있는 도구가 필수적이다. 많은 스타트업이 레이블 작성을 위한 솔루션을 제공하는 이유이다.

둘째는 학습 데이터의 품질이다. 학습 데이터의 품질 또한 인공지능 성능에 큰 영향을 미친다. 위에서 예를 들었던 의료 영상 이미지에 대해서 여러 의사가 진단을 작성했다고 하자. 만약 의사마다 진단 기준이 다르다면 학습 데이터의 일관성이 떨어지고 인공지능의 성능이 나빠질 것이다. 사실 한명이 레이블을 작성하더라도 매번 동일한 기준을 적용하기는 어렵다. 데이터 품질을 높이는 한가지 방법은 학습된 인공지능의 출력 결과와 레이블이 다른 데이터를 재점검하는 것이다.

셋째는 산업 현장 데이터의 변화이다. 데이터의 변화 원인은 다양하다. 앞의 예시인 의료 영상 이미지의 경우를 생각해보자. 먼저 대상 데이터 자체의 변화가 있다. 기존에 없던 새로운 병이 생긴다면 인공지능은 엉뚱한 진단을 내릴 것이다. 다음으로 데이터 생성 환경의 변화가 있다. 의료 영상 이미지를 촬영하는 장비의 변경은 의료 영상 이미지에 변화를 초래한다. 이러한 데이터의 변화를 감지하고 데이터 추가 구성, 환경 조정 등의 조치가 적절하게 이루어져야 한다.

많은 기업의 연구자들이 슈퍼 인공지능을 만들기 위해 알고리즘에 집중하고 있다. 물론 더욱 일반적이고 범용적인 알고리즘의 개발도 매우 중요하다. 하지만 인공지능을 산업 현장에 적용하기 위한 요건의 중심엔 데이터가 있다. 도메인 지식과 현장의 데이터가 중심이 된 적용 성공 사례가 많아질 때, 기술과 시장의 상호작용이 활발하게 이루어져 제대로 된 인공지능 생태계가 만들어질 수 있다.

Copyright © 한겨레신문사 All Rights Reserved. 무단 전재, 재배포, AI 학습 및 활용 금지

이 기사에 대해 어떻게 생각하시나요?