[우리가 AX 주역]〈24〉하이퍼엑셀, LLM에 최적화된 AI반도체 기업

김명희 2024. 7. 7. 16:38
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

하이퍼엑셀은 거대언어모델(LLM)에 최적화된 인공지능(AI) 반도체 개발 기업이다.

하이퍼엑셀은 김 대표를 주축으로 KAIST 연구소에서 LLM 특화 반도체 연구개발(R&D)을 시작하는 등 창업 이전부터 LLM 특화 반도체 개발에 주력해왔다.

서비스 가능한 다양한 LLM 반도체 플랫폼 개발로 기업, 연구소, 대학, 생성형AI 기업 등에서의 제조 리스크를 최소화할 수 있을 것으로 기대했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

하이퍼엑셀은 거대언어모델(LLM)에 최적화된 인공지능(AI) 반도체 개발 기업이다.

2023년 1월 KAIST 전기및전자공학부 교수인 김주영 대표가 창업한 교원창업기업이다. 창업한 지 1년도 되지 않아 미래에셋벤처투자와 KB인베스트먼트 등으로부터 60억원의 시드 투자를 유치했다.

하이퍼엑셀은 김 대표를 주축으로 KAIST 연구소에서 LLM 특화 반도체 연구개발(R&D)을 시작하는 등 창업 이전부터 LLM 특화 반도체 개발에 주력해왔다. 경쟁사 대비 2년 이상 빨랐다.

지난해 7월 AI 반도체 'LPU(Latency Processing Unit)'를 개발했다. 세계 최초 LLM 추론 특화 반도체 LPU로 저비용, 저지연, 도메인 특화가 장점이다.

기존 고비용·저효율 그래픽처리장치(GPU)를 대체할 대항마로 선보인 것이다. 엔비디아 A100 기반 슈퍼컴퓨터보다 성능은 최대 50%, 가격 대비 성능은 2.4배 가량 높였다.

이를 기반으로 같은 해 11월 프로그래머블반도체(FPGA) 기반으로 LPU 8개를 탑재한 생성형 AI 전용 서버 '오리온'을 선보였다. 지난 4월 공개된 메타의 생성형 AI '라마3'를 오리온으로 구동시켜 본 결과 서비스 답변 속도가 메타 자체 서비스 대비 30~50% 빠르다는 것을 확인했다.

하이퍼엑셀의 생성형 AI 전용 서버 '오리온'

하이퍼엑셀은 이러한 생성형 AI 특화 반도체와 서버를 글로벌 시장에 공급할 계획이다.

미국의 반도체 설계(팹리스) 기업 '그로크(Groq)' 등이 유사 솔루션을 개발하고 있지만 기술이나 성능 면에서 훨씬 우위에 있다고 판단했다. 국내의 우수한 반도체 생태계도 이러한 자신감을 뒷받침한다.

오리온 서버와 서버랙 솔루션 판매, 생성형 AI 서비스 인프라 제공, 지식재산(IP) 라이선싱까지 다양한 비즈니스모델(BM)을 제시했다. 서비스 가능한 다양한 LLM 반도체 플랫폼 개발로 기업, 연구소, 대학, 생성형AI 기업 등에서의 제조 리스크를 최소화할 수 있을 것으로 기대했다.

〈인터뷰〉김주영 하이퍼엑셀 대표 “저비용, 고효율 AI 반도체로 생성형 AI 확산 앞장”

김주영 하이퍼엑셀 대표

김주영 하이퍼엑셀 대표는 “생성형 AI 특화 AI 반도체와 솔루션을 통해 AI 서비스 혜택을 모두가 누릴 수 있도록 지원하겠다”고 밝혔다.

김 대표는 고비용 GPU의 낮은 효율성은 생성형 AI 서비스 확산에 걸림돌이 될 것이라고 봤다.

오픈AI의 '챗GPT'를 비롯해 구글 '제미나이', 메타 '라마' 등 빅테크 기업 LLM은 수천억개 이상 매개변수를 가지고 있어 고성능 GPU가 필요하다. AI 수요가 급격히 늘어나면서 컴퓨팅파워에 들어가는 천문학적 비용은 물론 공급 문제까지 제기되고 있다. AI 특화 반도체가 필요한 이유다.

김 대표는 궁극적으로 트랜스포머 AI 기술이 AI 칩 시장 성장을 주도하고, 2032년이면 전체 AI 칩 시장의 44%를 차지할 것이라고 전망했다. 범용적 GPU 대신 △AI 모델 학습 △LLM 특화 △비전 특화 등 서비스별 특화 AI 반도체로 세분화될 것이라고 예상했다.

김 대표는 “기존 GPU는 크기와 전력 문제로 확장성에 한계가 있다”며 “온디바이스와 모바일 시장까지 고려한 AI반도체 AI 2.0 시대를 이끌어 갈 것”이라고 강조했다.

김명희 기자 noprint@etnews.com

Copyright © 전자신문. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?