엑시큐토치 알파 출격…“모바일서 LLM 최적 구동”

이상덕 기자(asiris27@mk.co.kr) 2024. 5. 2. 14:45
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

파이선 기반 머신러닝 프레임워크인 엑시큐토치(ExecuTorch) 알파 버전이 공개됐다.

파이토치는 2일 자사의 홈페이지를 통해 "알파 버전에서는 대규모 언어 모델(LLMs)과 대형 머신러닝 모델을 모바일 기기로 구현하는 데 중점을 두었다"면서 "특히 API를 안정화하고 설치 과정을 개선했다"고 강조했다.

엑시큐토치는 메타(Meta)의 라마(Llama) 2를 지원한다.

LLM을 모바일 기기에 적용하고자 엑시큐토치는 양자화 등 다양한 모델을 사용했다고 말했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

엑시큐토치
파이선 기반 머신러닝 프레임워크인 엑시큐토치(ExecuTorch) 알파 버전이 공개됐다. 파이토치는 2일 자사의 홈페이지를 통해 “알파 버전에서는 대규모 언어 모델(LLMs)과 대형 머신러닝 모델을 모바일 기기로 구현하는 데 중점을 두었다”면서 “특히 API를 안정화하고 설치 과정을 개선했다”고 강조했다.

엑시큐토치는 메타(Meta)의 라마(Llama) 2를 지원한다. 또 라마3에 대한 초기 지원도 제공한다. 이번 개발은 모바일 기기에서 계산, 메모리, 전력의 효율을 높였다는데 뜻이 깊다. LLM을 모바일 기기에 적용하고자 엑시큐토치는 양자화 등 다양한 모델을 사용했다고 말했다.

특히 모델을 4비트로 압축하여 메모리 사용량을 크게 줄일 수 있는 GPTQ를 지원하는 한편, 다양한 CPU 아키텍처에 최적화해 추론할 수 있는 XNNPack에 중점을 뒀다.

파이토치는 “아이폰 15 프로(iPhone 15 Pro), 아이폰 15 프로 맥스(iPhone 15 Pro Max), 삼성 갤럭시 S22, S23, S24 등 각종 기기에서 라마(Llama)2 7B(70억 파라미터 버전)을 효율적으로 구동할 수 있다고 강조했다. 현재 파이토치는 애플 퀄컴과 긴밀히 협의 중이다.

마치 파이선 프로그램을 디버깅하듯이 모델을 디버깅할 수 있는 SDK를 제공한다. 이를 통해 모델 성능을 분석하고 병목을 확인할 수 있다.

엑시큐토치는 메타 퀘스트3에 손 추적용으로 활용되고 있으며 레이밴 메타 스마트글래스에도 활용 중이다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?