[이랜서 칼럼] AI 준지도학습, 반도체 공정 비전 AI 분야서 각광

서대호 다겸 대표 2024. 6. 1. 17:33
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

(지디넷코리아=서대호 다겸 대표)[이랜서칼럼]은 ‘IT를 기반으로 자유롭게 일하는 21세기형 전문가’를 지칭하는 ‘이랜서’(e-Lancer)들이 21세기형 일과 생활에 대한 인사이트와 노하우를 공유하는 장입니다.

“미국과 영국, 독일에서 알렉사의 사용자 음성 인식을 25% 이상 개선했다. 준지도학습(semi-supervised learning) 기술을 이용해 알렉사의 머신러닝 관련 요소를 강화하는 방법을 사용했다. 준지도학습 기술 덕분에 같은 정확성을 구현하는 데 필요한 '분류된 데이터' 양을 40배 가까이 줄일 수 있었다.”

위 내용은 아마존의 CEO 제프 베조스가 주주 서한에 쓴 글이다. 준지도학습을 통해 기존 지도학습과 비슷한 성능을 구현하기 위한 학습 데이터량을 40배 가까이 줄였다는 내용이다. 아마존 같은 빅테크 기업들의 AI시장 선점 경쟁이 뜨겁다. 베조스가 말한 준지도학습은 무엇일까?

이는 글자 그대로 지도학습에 준하는 AI기술이다. 구체적으로, AI의 지도학습(사람이 부여한 레이블이 있는 데이터로 인공지능을 학습 시키는 방법)과 비지도학습(사람이 부여한 레이블이 없는 데이터를 주고 컴퓨터가 스스로 데이터의 패턴이나 구조를 찾아내게 하는 학습 방법)의 중간에 있는 방법이다. 레이블이 있는 데이터를 먼저 지도학습으로 학습 후, 학습한 모델을 레이블이 없는 데이터에 적용해 '수도 레이블(pseudo label, 학습을 거친 모델이 예측한 레이블)'을 생성하는 것이다, 그리고 해당 '수도 레이블'로 또 지도학습을 수행한다. 이 과정을 반복적으로 수행하면 적은 양의 데이터로도 대량의 데이터 학습이 가능하다.

이러한 준지도학습은 데이터 레이블이 쉽지 않은 고가의 장비를 대상으로 많이 쓰인다. 최근들어 특히 반도체 공정 또는 완성된 웨이퍼의 불량을 판별하는데 최신 AI 기술이 많이 쓰이는 상황에서 대당 10억원이 쉽게 넘어가는 장비나 개당 1천만원이 쉽게 넘어가는 웨이퍼에 대해 레이블 있는 데이터를 충분히 확보하기에는 현실적으로 비용 부담이 너무 크다. 이전에는 데이터 부족 문제를 이미지 증강(augmentation) 기법(이미지 데이터를 다양한 방식으로 변형해 새로운 이미지를 생성하는 기법)을 활용해 해결하려고 했으나, 이 경우 증강 과정에서 원본 이미지의 중요한 의미론적 정보가 훼손되어 학습의 정확도를 떨어뜨리게 됐다. 

서대호 다겸 대표

이에 레이블 데이터 없이 one class classification 기반의 비지도학습을 하려는 시도가 최근에 많이 생겼지만, 이 역시 기존 지도학습에 비해 정확도가 떨어지고 정상과 비정상의 임계값을 작업자의 경험적 감에 의존하는 문제가 발생할 뿐더러, 다중 비정상 클래스 분류는 불가하다는 한계를 지녀 해결책이 될 수 없다.

이에, 지도학습과 비슷한 정확도와 성능을 지니면서도, 학습에 필요한 레이블 데이터 수를 획기적으로 감축한 준지도학습이 반도체 공정 비전 AI 분야에서 최근들어 각광받게 됐다. 준지도학습의 대표적인 방법은 '수도 레이블링'을 활용한 방법이다. 지도학습으로 레이블이 있는 데이터를 학습하고, 그렇게 학습한 모델을 활용해 레이블이 없는 데이터에 레이블을 붙인 수도 레이블을 생성한다. 수도 레이블 정보가 생성한 데이터는 기존의 레이블이 있는 데이터와 같이 활용돼 모델이 다시 학습된다. 이때 'FixMatch'와 같은 방법론을 활용해 수도 레이블 데이터의 신뢰도와 일관성을 높이는 기법을 쓰기도 한다.

FixMatch는 레이블이 없는 데이터에 대해 약한 증강을 적용시킨 이미지가 모델을 통과한 출력값이 특정 임계값(수도 레이블로 사용하기 위한 기준값)을 넘어야 수도 레이블이 생성되며(신뢰도), 해당 수도 레이블과 강한 증강을 적용한 출력값 사이의 크로스 엔트로피(cross entropy, 모델의 예측과 수도 레이블 사이의 차이를 줄이는 방법)를 적용해 분포가 같아지도록 학습(일관성)한다.

국내 연구진에서 최근 웨이퍼 빈 맵(WBM) 데이터 9개 클래스 분류 문제를 약 17만개의 레이블 데이터로 WideResNet 지도학습으로 학습한 모델과 비교했을 때, 20%의 정도의 데이터로만 대조학습(임베딩 공간에서 유사한 이미지는 가깝게, 다른 이미지는 멀어지도록 임베딩을 재조정하는 방법)을 결합한 준지도학습 방법이 더 높은 정확도(98.07%)를 보였다. 더욱 놀라운 사실은 1% 정도의 데이터로만 같은 방식으로 학습했을 때도 정확도가 96.88%로 크게 차이가 나지 않았다는 사실이다.

반도체 공정이 복잡하고 조밀해질수록 AI를 활용한 품질검사에 대한 수요는 늘어날 전망이다. 최근 시도하고 있는 2나노미터 공정은 삼성전자 기준 수율이 60%도 못 미칠 것으로 전망하고 있다. 이에 따라 품질검사를 통한 수율 증대가 반도체 기업의 핵심 경쟁력으로 부상하고 시장 규모도 커질 전망이다(글로벌 반도체 웨이퍼 검사 시장 연평균 10.6% 성장 전망, future market insights).

이에 따라 저비용으로도 빠르게 데이터를 확보해 높은 정확도를 끌어낼 수 있는 준지도학습 기반 비전 AI 학습방법론이 각광을 받을 것으로 예상된다. 향후 실제 현장에서 발생하는 복잡 혼합패턴, 공정 과정 중에 발생하는 비디오 데이터 등이 현장에서 제공되어 연구에 활용된다면 더욱 높은 품질의 반도체 공정 특화 AI 모델이 탄생할 것으로 생각한다.

◆ 필자 서대호 대표는...

- 현 다겸(주) 대표이사

- 전 한국과학기술원 연구위원

- 전 한국전자기술연구원 연구위원

- 연세대 정보대학원 박사과정 수료

- 한양대 일반대학원 산업공학 졸업(공학 석사)

- 한양대 정보시스템학 졸업(공학 학사)

- 대표 저서:  『1년 안에 AI 빅데이터 전문가가 되는 법: 4차 산업혁명 시대의 최고의 직업』

*다겸은 머신비전 AI 카메라 개발업체로 반도체, 배터리 등 미세공정이 요구되는 공장에 납품하고 있다. 고속 움직임 과정에서 수백마이크로미터 단위의 미세 오차를 비전과 음향으로 판별하고 분석하는 솔루션이다.

서대호 다겸 대표(seo_daeho@naver.com)

Copyright © 지디넷코리아. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?