스냅드래곤 8 엘리트 5세대 NPU 성능은?…'실리콘 고문' 해봤더니
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
스냅드래곤 8 엘리트 5세대(Gen 5) 특징 중 하나는 신경망처리장치(NPU) 성능이다.
다만 기기에서 발열이 느껴지지 않았고 앱 재기동 시 즉시 25tok/s 속도로 돌아왔다는 점을 고려할 때, 이는 NPU 성능보다는 사용된 LLM 모델의 최적화 이슈가 원인으로 추정된다.
앞선 세대 AP들이 최고 14~15tok/s 수준이었던 것을 고려하면 성능 향상이 뚜렷하다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

스냅드래곤 8 엘리트 5세대(Gen 5) 특징 중 하나는 신경망처리장치(NPU) 성능이다. 이전 세대 대비 성능이 37~39% 향상됐다. NPU는 딥러닝이나 머신러닝 등 AI 연산을 효율적으로 처리하기 위해 설계된 반도체 가속기다. CPU보다 AI 연산을 빨리 처리하면서 전력 소모는 훨씬 적다.
퀄컴 최신 칩 AP를 네트워크 접속을 차단한 상태에서 거대언어모델(LLM)을 가동, 실질적인 체감 NPU 성능이 어느 정도인지 확인하는 작업을 거쳤다. LLM은 70억~80억개의 파라미터를 지닌 모델이다. 2020년 최초 등장 당시 이 덩치를 감당하기 위해서는 최소한 RTX3090 수준 그래픽카드나 A100같은 서버 전용 그래픽카드가 필수였다.
실측을 위해 오픈소스 머신러닝컴플리케이션(MLC) LLM 기반의 'MLC Chat' 앱을 활용했다. 테스트 모델은 현재 온디바이스 AI의 표준 격인 메타의 '라마 3(Llama-3)-8B'다. 이 모델은 4비트 양자화(INT4) 과정을 거쳐 스마트폰 NPU의 한계를 시험하기에 적합하다. 외부 변수를 통제하기 위해 '비행기 모드'와 화면 밝기 50% 고정 상태에서 고강도 추론 연산을 지속하며 변화를 관찰했다.
최초 테스트에서 인사나 날씨 등 간단한 질문을 몇개 던지자 프리필(Prefill)은 68tok/s, 디코드(Decode)는 25.1tok/s를 기록했다. 이어 소설 및 대본 창작이나 경제 현안 분석 등 고난도 작업을 요구했음에도 20tok/s 수준이 유지됐다.
장시간 질문을 이어가자 잠시 15tok/s 속도로 하락하기도 했다. 다만 기기에서 발열이 느껴지지 않았고 앱 재기동 시 즉시 25tok/s 속도로 돌아왔다는 점을 고려할 때, 이는 NPU 성능보다는 사용된 LLM 모델의 최적화 이슈가 원인으로 추정된다. 실사용 단계에서 성능 지속성을 입증한 셈이다.
프리필은 질문을 받고 문맥을 파악하는 입력 처리 속도, 디코드는 추론 및 답변(토큰)을 생성하는 속도를 의미한다. 디코드 20tok/s 이상의 속도는 사람의 평균 읽기 속도보다 3~4배 빨라 이용자가 쾌적함을 느끼는 수준이다. 앞선 세대 AP들이 최고 14~15tok/s 수준이었던 것을 고려하면 성능 향상이 뚜렷하다.
디바이스 내 AI 연산 능력은 일상적인 질의 응답은 물론 고도화된 콘텐츠 제작 및 개인 맞춤형 추천까지 폭넓은 작업을 지원한다. 파일 개요(File Overview), 나이트그래피(Nightography) 비디오, 포토 어시스트(Photo Assist), 나우 너지(Now Nudge) 등 갤럭시 AI 생태계에서 활용 폭을 넓혀준다.
특히 고성능 카메라와 영상 코덱(APV)을 갖춘 갤럭시 S26 울트라에서 AI는 콘텐츠 제작에 기여하는 바가 크다. 저조도 사진 촬영에서 노이즈 감소 기능을 수행하고 장면을 분석해 피사체와 배경을 구분 처리한다.
퀄컴 관계자는 “스냅드래곤 8 엘리트 Gen5는 단순한 칩셋 업그레이드가 아니라 스마트폰 역할 자체를 재정의하는 플랫폼”이라고 설명했다.
이형두 기자 dudu@etnews.com
Copyright © 전자신문. 무단전재 및 재배포 금지.
- AI 시대 '전력폭증' 현실화…“2040년 최대 138GW 찍는다”
- 美 일방적 휴전 연장 VS 이란 '호르무즈 통행료 법제화'…韓 4차 석유최고가제 '초읽기'
- LG-엔비디아, 기술 동맹 격상…'엑사원 생태계' 넓힌다
- “6개월이면 데이터센터 뚝딱”…아이에이, '초소형 MDC' 로 AI 인프라 시장 공략
- “아직도 폰이 안 꺼졌네”…전력관리·성능 다 잡은 스냅드래곤 8 엘리트 5세대
- “평균 수명 두 배 넘겨”…15살 英 토끼, 세계 최고령 등극
- 수십만 통신장비도 AI로 점검…LGU+, 보안업체와 기술검증 착수
- “빠른 배송 더 빠르게”…쿠팡, '배송 우수 선정상품' 도입한다
- 삼성바이오, 1분기 실적 선방했지만…파업 리스크에 성장 시계 '흔들'
- [WIS 2026] “일상 어디서나 AI”…삼성전자, 'AI 동반자' 환경 구축