서울시립대 노영민 교수, 고성능 이미지 분류 모델 개발

다양한 구동 환경서 적용되는 인공지능 모델

[서울=뉴시스] 서울시립대 인공지능학과 기계지능연구실(MIL) 연구팀 윤석주 석사과정(왼쪽), 노영민 교수. (사진=서울시립대 제공) *재판매 및 DB 금지

[서울=뉴시스]이주영 인턴 기자 = 서울시립대 인공지능학과 기계지능연구실 노영민 교수 연구팀이 최근 컴퓨터 비전 분야 CVPR 2024에 제출한 논문이 최종 채택됐다.

IEEE/CVF 주관하는 CVPR(Computer Vision and Pattern Recognition Conference)은 컴퓨터 비전 및 인공지능·패턴인식 분야에서 최고 권위 학회로 인정받고 있다. 이번 CVPR 2024는 오는 6월19일부터 21일까지 미국 시애틀 컨벤션 센터에서 개최될 예정이다.

해당 논문의 제목은 'SHViT: Single-Head Vision Transformer with Memory Efficient Macro Design'이다. 컴퓨터 비전 분야에서 새로운 모델을 소개해 속도와 성능을 모두 개선하는 것에 초점을 맞추고 있다.

[서울=뉴시스] 연구팀이 제안한 SHViT 모델의 구조. (사진=서울시립대 제공) *재판매 및 DB 금지

연구팀은 다양한 인공지능 모델의 구동 환경(GPU, CPU, Mobile)에서 이미지 분류, 객체 탐지 및 영상 분할에 대해 세계 최고의 성능과 속도를 보여주는 컴퓨터 비전 backbone 모델을 제안했다. 이 논문에서는 기존의 컴퓨터 비전 모델들이 갖고 있는 계산 중복도 문제를 지적하고, 이를 해결하기 위해 새로운 설계 방법을 제시했다.

이 모델은 입력 이미지를 큰 조각으로 처리하고, 단일 헤드만을 사용하여 중복된 계산을 줄이는 방식을 채택하여 모델의 성능은 유지하면서도 속도를 크게 향상했다.

본 연구는 한국연구재단 개인기초연구사업과 서울시립대학교 데이터사이언스 융합인재양성사업단의 지원으로 수행되었다.

☞공감언론 뉴시스 jooyoung4452@newsis.com

사회

서울시립대 노영민 교수, 고성능 이미지 분류 모델 개발