KAIST 김창익 교수팀, 차세대 패러다임 동영상 인식기술 개발
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
KAIST(총장 이광형)는 전기및전자공학부 김창익 교수 연구팀이 초고효율 동영상 인식 모델 '비디오맘바(VideoMamba)'를 개발했다고 23일 밝혔다.
연구팀은 동영상 인식 모델의 효율성을 극대화하기 위해 비디오맘바에 1차원 데이터 처리에 국한된 기존의 선택적 상태 공간 매커니즘을 3차원 시공간 데이터 분석이 가능하도록 고도화한 '시공간적 전방 및 후방 선택적 상태 공간 모델(spatio-temporal forward and backward SSM)'을 도입했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
낮은 연산 복잡도 및 메모리 사용량, 빠른 추론 속도로 다양한 응용 분야에서 활용 기대
KAIST(총장 이광형)는 전기및전자공학부 김창익 교수 연구팀이 초고효율 동영상 인식 모델 '비디오맘바(VideoMamba)'를 개발했다고 23일 밝혔다.
비디오맘바는 기존 트랜스포머 기반 모델들이 가지고 있는 높은 계산 복잡성을 해결하기 위해 설계된 새로운 동영상 인식 모델이다.
연구팀의 모델은 선택적 상태 공간 모델(Selective State Space Model, Selective SSM) 메커니즘을 활용해 시퀀스 데이터의 문맥을 더 잘 이해할 수 있고 선형 복잡도로 효율적인 처리가 가능하다. 이를 통해 동영상의 시공간적 정보를 효과적으로 포착해 긴 종속성을 가진 동영상 데이터도 효율적으로 처리할 수 있다.
연구팀은 동영상 인식 모델의 효율성을 극대화하기 위해 비디오맘바에 1차원 데이터 처리에 국한된 기존의 선택적 상태 공간 매커니즘을 3차원 시공간 데이터 분석이 가능하도록 고도화한 '시공간적 전방 및 후방 선택적 상태 공간 모델(spatio-temporal forward and backward SSM)'을 도입했다.
김 교수는 "비디오맘바의 빠른 처리 속도와 낮은 메모리 사용량, 그리고 뛰어난 성능은 우리 생활에서의 다양한 동영상 활용 분야에 큰 장점을 제공할 것이다"라고 연구의 의의를 설명했다. 김솔문 인턴
Copyright © 대전일보. 무단전재 및 재배포 금지.
- 세종 싱싱장터 '4호 소담점' 내년 초 개장…집현동에 '수산물유통센터' 건립 검토 - 대전일보
- "전기차 화재 또"… 아산 모종동 아파트 지하주차장서 화재 - 대전일보
- 대전 아파트 공사장 근로자 1명 토사 매몰…사망한 채 발견 - 대전일보
- 이재명 "법정 향하는 아내, 죽을만큼 미안… 희생제물 됐다" - 대전일보
- 오늘 '금융시장·은행' 1시간 늦게 개장…지연 이유는 - 대전일보
- 이준석 "출연료 3000만 원? 대표가 당협행사에 돈을 왜 받나" - 대전일보
- [영상] "무인카페서 534만 원 어치 공짜로"… 간큰 대전 고등학생들 - 대전일보
- 與, '김여사 특검법' 본회의 표결 불참 결정 - 대전일보
- 아산 음식점 화재 벌써 지난해 2배…"대형화재 우려 후드·덕트 각별 주의" - 대전일보
- KT충남충북광역본부, 청남대에 AI 로봇 도입 확대 - 대전일보