AI 모델, 컴퓨터 실행코드로 바꾸는 시간 절반 이하로 뚝

이병구 기자 2025. 8. 12. 08:01
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

인공지능(AI) 모델이 작동하려면 인간의 명령을 컴퓨터의 연산장치가 수행할 수 있도록 번역하는 '컴파일(compile)' 과정이 필요하다.

국내 연구팀이 AI 모델을 실행 가능한 프로그램 형태로 가공하는 '오토튜닝'에 걸리는 시간을 절반 이하로 줄이는 기술을 개발했다.

울산과학기술원(UNIST)은 이슬기 컴퓨터공학과 교수팀이 오토튜닝 과정을 최대 2.5배까지 빠르게 할 수 있는 기법을 개발했다고 11일 밝혔다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

UNIST
이슬기 울산과학기술원(UNIST) 컴퓨터공학과 교수. UNIST 제공

인공지능(AI) 모델이 작동하려면 인간의 명령을 컴퓨터의 연산장치가 수행할 수 있도록 번역하는 '컴파일(compile)' 과정이 필요하다. 국내 연구팀이 AI 모델을 실행 가능한 프로그램 형태로 가공하는 '오토튜닝'에 걸리는 시간을 절반 이하로 줄이는 기술을 개발했다.

울산과학기술원(UNIST)은 이슬기 컴퓨터공학과 교수팀이 오토튜닝 과정을 최대 2.5배까지 빠르게 할 수 있는 기법을 개발했다고 11일 밝혔다. 연구결과는 7월 7일부터 9일까지 미국 보스턴에서 열린 컴퓨터 시스템 분야 학회 '운영체제 설계 및 구현(OSDI)'에서 발표됐다.

'고양이 사진을 분류해 줘'라는 간단한 명령도 컴퓨터가 수행하려면 수천 줄에 이르는 복잡한 코드가 필요하다. 인간의 의도에 맞게 연산장치가 작동하도록 일종의 번역이 필요한 셈이다.

오토튜닝은 명령을 수행할 수 있는 수많은 코드의 조합 중 효율적인 형태를 자동으로 찾아주는 기술이다. 유용하지만 수십 분에서 길면 수 시간 이상 걸리고 전력 소모가 크다는 점이 해결 과제다.

연구팀은 딥러닝 모델 안에서 반복되는 계산 구조가 많다는 점에 주목했다. 유사한 연산은 코드 조합을 새로 찾는 대신 기존 결과를 재활용해 오토튜닝 속도를 높인 것이다.

개발된 방식을 기존 오토튜닝에 적용한 결과 동일한 성능의 실행 코드를 생성하는 데 걸리는 시간이 중앙처리장치(CPU) 기준 평균 2.5배, 그래픽처리장치(GPU) 기준 평균 2배 단축됐다. AI 시스템의 탄소 발자국을 감소시킬 것으로 기대된다.

이 교수는 "컴파일 시간을 줄이면서도 GPU나 CPU를 직접 쓰는 횟수를 줄여 제한된 연산 자원을 효율적으로 쓰고 전력 소모도 줄일 수 있다"고 밝혔다.

<참고 자료>
- usenix.org/conference/osdi25/presentation/jeong

[이병구 기자 2bottle9@donga.com]

Copyright © 동아사이언스. 무단전재 및 재배포 금지.