AI반도체 테스트...“과학이자 공학이자 예술”
WEEKLY BIZ 뉴스레터 구독하기 ☞ https://page.stibee.com/subscriptions/146096
우리는 건강검진을 받는다. 심장 상태를 알기 위해 몸에 청진기를 대거나 심전도를 측정한다. 내시경, 초음파, 엑스레이로 정밀 검사도 하고, 좀 더 확실한 결과를 얻고자 조직 검사도 한다. 지적 능력 검사도 한다. 아이큐(IQ) 테스트는 지능의 수준을 표준점수로 수치화한 것이다. 대학수학능력시험 등 학업 평가까지 감안하면 인간의 삶은 각종 테스트의 연속이라 할 수 있다. 인간은 완전하지 않기 때문이다.
마찬가지로 인공지능(AI) 반도체인 그래픽처리장치(GPU)와 첨단 반도체인 고대역폭메모리(HBM)도 개발과 생산의 각 단계에서 각종 난도(難度) 높은 테스트 과정을 거친다. 반도체 테스트 과정은 ‘웨이퍼 단계 테스트’ ‘패키지 단계 테스트’ ‘응용 단계 테스트’ 등 크게 세 단계를 순차적으로 거친다.
먼저 반도체가 설계돼 각종 공정까지 마무리되면 원형 판인 웨이퍼 상태로 출력된다. 이때 웨이퍼 표면을 눈으로 보면 빛이 반사돼 무지개 색깔로 보인다. 하지만 그 속에는 원자 크기의 수조 개 트랜지스터가 만들어져 있고 서로 연결돼 있다. 이제 전압을 넣으면 동작을 한다. 이 웨이퍼 단계에서 테스트해서 우수 다이(die)를 고르고 불량품은 걸러낸다. 다이란 웨이퍼 위에 밀집된 수많은 작은 사각형 조각들로, 이 다이를 분리해 반도체 칩(chip)이 탄생한다. 웨이퍼 단계에서 테스트를 할 땐 금속 바늘로 이뤄진 검침(probe)을 쓰는데, 이 금속 바늘이 수만 개 달린 장치가 웨이퍼 테스트의 핵심 장치인 ‘프로브 카드(probe card)’이다. HBM과 같이 정보를 2진수로 바꿔 저장하는 메모리 반도체를 테스트할 땐 ‘1′과 ‘0′을 기억하는 수억 개의 ‘셀(cell)’이 모두 정상 동작하는지까지 확인한다. 일부 셀이 고장 난 경우, 여분의 셀로 대체하는 과정(repair)도 거친다. 그리고 전압, 온도, 공정 등을 고려한 최악의 가혹한 조건에서도 테스트(burn-in test)를 한다. 이때 살아남는 반도체 정상 다이만 골라 웨이퍼에서 절단해 패키지 단계로 넘어간다.
패키지 공정은 웨이퍼에서 잘라낸 다이(칩)에 전기적 연결 통로를 만들고, 열 배출 구조를 만드는 식으로 실제 반도체가 작동할 수 있게 제품화하는 공정이다. 이 패키지 단계에선 마치 자동차가 최대 속력으로 달릴 수 있는지 확인하는 것처럼 데이터를 빨리 읽거나 쓸 수 있는지 테스트한다. GPU 계산 능력이나 HBM의 읽고 쓰기 능력도 정상 동작하는지 확인한다. HBM은 D램을 여러 겹 쌓아서 만들기 때문에, 다 쌓은 뒤에 전체 동작을 다시 확인한다. HBM은 반도체를 쌓아 올려 내부 연결 상태를 일일이 확인하기 어렵다는 특징이 있다. 그래서 HBM 맨 아래층을 이루는 ‘베이스 다이(base die)’란 반도체에 자체 테스트(self-test) 기능도 추가한다. 이렇게 되면 반도체에 이상이 생길 경우 테스트 과정에서 이상 유무를 단번에 알아챌 수 있다. 우리 몸도 건강이 안 좋아지면 안색이 나빠지고 식욕이 떨어지는 식으로 이상 신호를 내보내는 것과 유사하다.
마지막은 응용 단계 테스트이다. AI 컴퓨터는 GPU와 HBM을 인터포저 기판에 결합해 만든다. 인터포저는 실리콘으로 만든 기판이다. 이런 AI 컴퓨터가 최소한 256대 연결되면 AI 수퍼컴퓨터가 된다. 이때 다양한 초거대 생성형 AI를 활용해 수퍼컴퓨터에 학습과 추론을 시켜보며 정상 동작을 하는지 확인한다. AI 반도체인 GPU와 GPU 사이에도 충분한 속도로 정확하게 데이터가 오가는지 확인하는 한편, 데이터를 저장하고 뽑아 쓸 수 있는 HBM과 GPU 사이에도 병목 현상 없이 데이터가 원활하게 오가는지 분석한다. 챗GPT4와 같은 생성형 AI를 사용해 시간당 단어 생성 속도도 측정하고, 수십만 명의 사용자가 동시에 쓸 수 있는지도 확인한다. 마지막으로 안전성과 신뢰성을 체크한다. 테스트 단계가 후반부로 진행될수록 테스트 비용과 시간이 급격히 증가한다.
이렇게 AI 반도체는 설계와 공정 단계도 어렵지만 테스트 과정도 매우 어렵다. 많은 시간과 비용이 투입된다. 반도체 테스트는 고객과의 신뢰를 얻기 위한 사전 축적 과정이다. 매우 고난도의 기술과 장비가 필요하다. 이러한 테스트를 성공적으로 끝내야 마침내 인증을 받는다. 이후 양산 계약이 이뤄지고, 매출이 발생하며, 수익을 얻고 주가가 오른다. AI 반도체 테스트 과정은 지난한 과학(科學)이며 공학(工學)이며 마침내 예술(藝術)이다.
WEEKLY BIZ 뉴스레터 구독하기 ☞ https://page.stibee.com/subscriptions/146096
Copyright © 조선일보. 무단전재 및 재배포 금지.