“연산량‧메모리 사용량↓속도 4배↑” KAIST, 새 동영상 인식기술 개발
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
기존 비디오 모델보다 낮은 연산량과 메모리 사용만으로 정확도와 추론 속도를 획기적으로 높인 동영상 인식기술이 국내 연구진에 의해 개발됐다.
KAIST는 전기및전자공학부 김창익(사진) 교수 연구팀이 초고효율 동영상 인식 모델 '비디오맘바(VideoMamba)'를 개발했다고 23일 밝혔다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
- 초고효율 모델 ‘비디오맘바’ 개발
[헤럴드경제=구본혁 기자] 기존 비디오 모델보다 낮은 연산량과 메모리 사용만으로 정확도와 추론 속도를 획기적으로 높인 동영상 인식기술이 국내 연구진에 의해 개발됐다.
KAIST는 전기및전자공학부 김창익(사진) 교수 연구팀이 초고효율 동영상 인식 모델 ‘비디오맘바(VideoMamba)’를 개발했다고 23일 밝혔다.
비디오맘바는 기존 트랜스포머 기반 모델들이 가지고 있는 높은 계산 복잡성을 해결하기 위해 설계된 새로운 동영상 인식 모델이다. 기존 트랜스포머 기반 모델들은 셀프-어텐션(self-attention)이라는 메커니즘에 의존해 계산 복잡도가 제곱으로 증가하는 문제를 가지고 있었다.
김창익 교수 연구팀의 비디오맘바는 선택적 상태 공간 모델(SSM) 메커니즘을 활용해 선형 복잡도로 효율적인 처리가 가능하다. 이를 통해 비디오맘바는 동영상의 시공간적 정보를 효과적으로 포착해 긴 종속성을 가진 동영상 데이터도 효율적으로 처리할 수 있다.
연구팀은 동영상 인식 모델의 효율성을 극대화하기 위해 비디오맘바에 1차원 데이터 처리에 국한된 기존 선택적 상태 공간 메커니즘을 3차원 시공간 데이터 분석이 가능하도록 고도화한 시공간적 전방 및 후방 선택적 상태 공간 모델(SSM)을 도입했다. 이 모델은 순서가 없는 공간 정보와 순차적인 시간 정보를 효과적으로 통합해 인식 성능을 향상한다. 연구팀은 다양한 동영상 인식 벤치마크에서 비디오맘바의 성능을 검증했다.
비디오맘바는 영상 분석이 필요한 다양한 응용 분야에서 효율적이고 실용적인 솔루션을 제공할 수 있다. 예를 들어, 자율주행에서는 주행 영상을 분석해 도로 상황을 정확하게 파악하고, 보행자와 장애물을 실시간으로 인식해 사고를 예방할 수 있다. 의료 분야에서는 수술 영상을 분석해 환자의 상태를 실시간으로 모니터링하고 긴급 상황 발생 시 신속히 대처할 수 있다. 스포츠 분야에서는 경기 중 선수들의 움직임과 전술을 분석해 전략을 개선하고, 훈련 중 피로도나 부상 가능성을 실시간으로 감지해 예방할 수 있다.
김창익 교수는 “비디오맘바의 빠른 처리 속도와 낮은 메모리 사용량, 그리고 뛰어난 성능은 우리 생활에서의 다양한 동영상 활용 분야에 큰 장점을 제공할 것”이라고 말했다.
이번 연구결과는 오는 9월 이탈리아 밀라노에서 열리는 컴퓨터 비전 분야 최우수 국제학회 중 하나인 ‘European Conference on Computer Vision(ECCV) 2024’에서 발표될 예정이다.
nbgkoo@heraldcorp.com
Copyright © 헤럴드경제. 무단전재 및 재배포 금지.
- ‘부채도사’ 개그맨이자 가수 장두석, 지병으로 별세…향년 66세
- ‘홍명보 선임 논란’에 축구협회 입장은?…“특혜 없었다”
- 백종원 '연돈불카츠 사태' 입 열었다…"기업 죽이기"
- '바이든 후계자' 해리스 남편, 홍석천과 인연 재조명…“참 좋은 분”
- '병역 기피' 유승준, UFC 데뷔 준비 깜짝 근황…"내 팔뚝이 제일 굵다"
- ‘음주운전 2번’ 박시연 민낯 근황 공개…"첫 리얼 쌩얼"
- 황정음의 '7살 연하남'은…누적연봉 50억, 강남건물주 김종규
- 형부가 내 비키니 사진을?…“소름 돋는 형부, 언니도 문제 없데요” 처제의 하소연
- ‘복통호소’ 24세女 뱃속서 1㎏ 머리카락 뭉치 나왔다…‘이 병’ 원인이었다
- “포장 뜯자마자” 삼성 충격사태…30만원짜리 신제품 사달났다