인텔, 인공신경망칩 탑재한 CPU 출시···'노트북 엣지AI 시대' 열었다

실리콘밸리=윤민혁 기자 2023. 12. 15. 00:00
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

■인텔, AI 에브리웨어 행사 개최
'코어 울트라' 출시···NPU 첫 장착
GPU 성능도 전 세대보다 2배 향상
인터넷 없이도 생성형AI 구동 가능
전자기기마다 칩셋 적용한 '엣지AI'
구글·애플·삼성 등도 앞다퉈 도입
[서울경제]

2023년이 생성형 인공지능(AI)이 대두된 한 해였다면 2024년은 손 안의 AI로 불리는 ‘엣지AI(온디바이스AI)’의 시대가 될 전망이다. 엣지AI는 스마트폰과 PC는 물론 반도체가 들어간 모든 전자기기에 AI 칩셋이 적용돼 정보통신기술(ICT) 인프라의 ‘말단(엣지)’에서 AI 연산이 이뤄지는 방식을 뜻한다. 생성형 AI의 막대한 연산 부담을 각 기기에서 덜어줄 뿐만 아니라 인터넷 연결 없이도 자체적으로 AI 구동이 가능하다는 장점을 지닌다. 주요 테크 기업들은 하드웨어·소프트웨어(SW) 전반에서 엣지AI 관련 제품들을 연달아 내놓으며 ‘온 세상의 AI’ 시대를 준비하고 있다.

인텔이 14일(현지시간) 공개한 인텔 코어 울트라. 사진제공=인텔

14일(현지 시간) 펫 겔싱어 인텔 최고경영자(CEO)는 미국 뉴욕 나스닥 본사에서 ‘AI 에브리웨어’ 행사를 열고 신형 모바일 중앙처리장치(CPU) ‘인텔 코어 울트라’와 서버용 CPU 제온 5세대를 출시했다. 겔싱어 CEO는 “AI 혁신이 세계 GDP 3분의 1을 차지할 전망으로 클라우드뿐만이 아니라 PC와 엣지에서 효과적으로 AI를 통합하고 실행할 수 있는 기술이 필요하다”고 강조했다.

인텔 코어 울트라는 PC용 CPU 중 최초로 인공신경망칩(NPU)를 탑재해 AI 성능을 강화했다. 역시 AI 연산에 쓰이는 그래픽처리장치(GPU) 성능도 전세대 대비 2배 향상됐다. 이를 통해 총 34TOPS(초당테라연산)의 연산이 가능하고, 결과적으로 생성형AI 성능을 1.7배 강화하는 동시에 전력당 성능비는 2.5배 향상됐다. NPU 탑재는 노트북 내 자체 생성형AI 구동을 가능케 한다. 실제 인텔 코어 울트라를 탑재한 노트북은 메타 생성형 AI ‘라마2-7B’를 인터넷 연결 없이도 구동할 수 있다. 인텔은 “마이크로소프트(MS), 어도비 등 100개 이상 기업과 협력해 ‘킬러앱’을 늘려갈 계획”이라고 밝혔다.

인텔의 행보는 최근 구글이 발표한 생성형AI ‘제미나이’와도 유사점을 갖는다. 구글은 제미나이를 성능과 자원 투입량에 따라 울트라·프로·나노로 구분했다. 가장 소규모인 나노는 텐서연산장치(TPU)를 탑재한 스마트폰 픽셀8 프로에서 통신 연결 없이도 구동된다. 구글 역시 생성형AI 개발단계부터 엣지AI를 고려한 셈이다. 아직 생성형AI를 공개하지 않은 애플도 최근 NPU가 탑재된 아이폰에서 사용할 수 있는 ‘저널’ 앱을 공개하며 엣지AI 활용에 시동을 걸었다. 아이폰 사용기록을 AI가 정리해주는 기능이다. 삼성전자 또한 갤럭시 스마트폰·노트북·웨어러블 기기는 물론 가전에까지 모두 NPU를 탑재하고 지난 11월 공개한 생성형AI ‘가우스’를 구동할 수 있도록 할 계획이다.

구글이 최근 공개한 생성형AI 제미나이는 규모 별 3가지 모델을 제공한다. 사진 제공=구글

빅테크가 일제히 엣지AI에 관심을 갖는 첫 번째 이유는 한정된 컴퓨팅 자원이다. 클라우드에서 구동되는 초거대 생성형AI는 학습과 가동에 천문학적인 비용이 든다. 엔비디아·AMD GPU 가격이 폭등한데다 반도체 수급 자체가 어렵고, AI가 작동할 때마다 드는 전기료도 부담이다. 실제 오픈AI는 지난해에만 5억4000만 달러의 손실을 봤다. 챗GPT 가동 비용은 일반 검색의 100~200배에 달한다. 각 기기가 중앙 클라우드의 연산 부담을 덜어줄 필요성이 커지고 있는 것이다.

통신 인프라의 한계도 여전하다. AI가 대세가 되면서 송수신량(트래픽)이 늘어날 전망인데다 5세대이동통신(5G)은 커녕 LTE 전국망 보급조차 이뤄지지 않은 국가도 많다. AI가 전통적인 IT 기기 외 차량, 로봇, CCTV 등 카메라 등 반도체가 필요한 온갖 기기에 적용될 수 있음을 감안하면 통신 연결 없이도 자체 구동 가능한 엣지AI의 필요성은 더욱 커진다. 올해 생성형AI가 주도했던 시장은 이미 엣지AI 시대에 기민하게 반응하고 있다. 모건스탠리는 지난 11월 보고서에서 “2023년이 생성형 AI·클라우드·GPU가 주를 이룬 한 해였다면 내년은 AI 보급이 확산되면서 작업량이 네트워크 엣지에 있는 각 디바이스로 옮겨간다”고 전망한 바 있다. 모건스탠리는 이와 함께 애플·퀄컴·미디어텍·샤오미 등을 엣지AI 주요 수혜주로 꼽았다. 국내 증시도 가파르게 움직이고 있다.

실리콘밸리=윤민혁 기자 beherenow@sedaily.com

Copyright © 서울경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?