GIST, 국제 AI 음향 인식 대회서 심사위원상 수상
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
DCASE 워크숍은 지난 9월 20일부터 22일까지 핀란드 탐페레에서 열렸고, 시상식은 22일 탐페레 홀에서 진행됐다.
GIST 오디오지능연구실 소속 학생(석사과정 김지원, 손상원 학생, 석박통합과정 송윤아 학생)과 한화비전 연구원(송일훈, 임정은 수석연구원)으로 구성된 'GIST-HanwhaVision' 팀은 'DCASE(IEEE AASP Challenge on Detection and Classification of Acoustic Scenes and Events) 챌린지 2023'에 참가해 '실내 음향 이벤트 탐지 부문(Task 4A)'에서 단일 모델 분야 1위와 앙상블 모델 분야 2위를 기록했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
(지디넷코리아=방은주 기자)광주과학기술원(GIST, 총장 임기철)은 전기전자컴퓨터공학부 오디오지능연구실(AiTeR, 김홍국 교수)과 한화비전(AI연구소 소장 노승인) 공동 연구팀이 세계 최대 전기·전자기술자협회(IEEE)의 신호처리소사이어티가 주관한 ‘국제 AI 음향 인식 경진대회(DCASE 챌린지 2023)' 워크숍에서 심사위원상(Judges’ award)을 수상했다고 12일 밝혔다.
DCASE 워크숍은 지난 9월 20일부터 22일까지 핀란드 탐페레에서 열렸고, 시상식은 22일 탐페레 홀에서 진행됐다.
GIST 오디오지능연구실 소속 학생(석사과정 김지원, 손상원 학생, 석박통합과정 송윤아 학생)과 한화비전 연구원(송일훈, 임정은 수석연구원)으로 구성된 'GIST-HanwhaVision' 팀은 ‘DCASE(IEEE AASP Challenge on Detection and Classification of Acoustic Scenes and Events) 챌린지 2023’에 참가해 ‘실내 음향 이벤트 탐지 부문(Task 4A)’에서 단일 모델 분야 1위와 앙상블 모델 분야 2위를 기록했다. 특히 워크숍에서 ‘심사위원상’을 수상해 연구 혁신성과 기술 완성도 및 논문 품질 등 다양한 기준에서 우수한 성과를 인정받았다.
심사위원상은 ‘DCASE 챌린지 2023’에 제출된 기술 리포트를 중심으로 연구 독창성과 우수성을 검토해 태스크(Task)별 1팀에게만 주어진다. GIST-한화비전 팀은 ‘실내 음향 이벤트 탐지 부문(Task 4A)’에서 중앙대, 샤오미, 삼성리서치 중국-난징 등 유수한 기관 15개 팀을 제치고 이 상을 수상했다.
‘실내 음향 이벤트 탐지 기술’은 실내 환경에서 발생할 수 있는 진공청소기 소리, 설거지하는 소리 등 10가지의 다양한 소리를 AI를 통해 탐지 및 구별하는 기술이다. 이 기술은 카메라를 통해 처리하는 데 제한이 있는 상황에서 소리만으로 음향 이벤트를 탐지할 수 있다는 강점을 통해 실내 상황 감시, AI스피커 등 다양한 애플리케이션에 활용할 수 있다.
이번 워크숍에서 'GIST-Hanwha Vision' 팀은 문제를 해결하기 위해 다양한 오디오 지능을 표현할 수 있는 AI 기술들을 접목해 고성능 실내 음향 이벤트 탐지 기술을 개발했다.(논문명: Label Filtering-Based Self-Learning for Sound Event Detection Using Frequency Dynamic Convolution with Large Kernel Attention)
구체적으로 ▲인공지능이 추론한 의사 정답을 학습에 활용하는 준지도 학습 기술 ▲사전 학습 훈련 모델 추론 결과를 기존 모델 추론 결과와 융합하는 기술 ▴성능 향상을 위한 데이터를 정제하는 기술, 그리고 ▲인공지능의 능력 향상을 위해 다양한 기법을 병합하는 앙상블 기술 접목 인공지능 모델로 우수한 성과를 달성했다.
김홍국 교수는 “이번 대회를 통해 얻은 경험과 개발 기술은 한화비전의 CCTV내 음향 이벤트 탐지에 적용될 예정"이라면서 "나아가 소셜미디어 콘텐츠의 음성구간 및 음향 이벤트 검출을 통해 보다 효율적이고 사용자 친화적인 서비스 개발에 노력하겠다”고 말했다.
GIST-HanwhaVision 팀의 참여 학생들은 “한화비전 연구원들과의 긴밀한 협업과 김홍국 교수님의 전문적인 지원 덕분에 세계적인 대회에서 인정받는 성과를 창출할 수 있었다”며 “지금의 성과를 바탕으로 오디오 인공지능 분야 연구를 더욱 심화시켜 오디오지능 기술 실용화와 사회적 가치 창출에 기여하겠다"고 밝혔다.
한편 GIST-AiTeR 팀이 소속된 GIST 오디오지능연구실(AiTeR, 지도교수 김홍국)은 음성 음향을 위한 AI 모델을 연구하고 있다. 음향 이벤트 탐지 뿐 아니라 음성 합성, 음성 잡음 제거, 음성 인식, 이상 상황 감지, 생체정보 처리 등의 다양한 연구를 국내 산학연 연구기관 및 매사추세츠공대(MIT) 등 해외연구기관과 공동으로 진행하고 있다.
이번 연구는 △2023년도 한화비전의 CCTV 내 딥러닝 기반 음원 분류 상품화 지원 사업 △과학기술정보통신부 및 정보통신기획평가원의 미디어 콘텐츠 음성 언어 현지화 기술개발 사업의 지원을 받아 이뤄졌다
방은주 기자(ejbang@zdnet.co.kr)
Copyright © 지디넷코리아. 무단전재 및 재배포 금지.
- 지스타2024 막 올라…미공개 게임대작 대거 공개
- "하필 수능날 날벼락"…경기 지역서 나이스 먹통, 1시간여 만에 복구
- 세금신고·복지신청, 한 곳에서...공공서비스 더 똑똑하고 편리해진다
- 경계 사라진 비즈니스...엔비디아·어도비 등 ‘빅테크 혁신 팁’ 푼다
- 이석우 두나무-마이클 케이시 DAIS 협회장 "블록체인 산업, 외부 의존도 낮춰야"
- 아파트 주차장서 또 벤츠 전기차 화재…이번엔 국내산 배터리
- "생각보다 안 팔리네"…中 업체, 폴더블폰 철수 고민
- [현장] "사람 구하고 불끄고, 미아도 찾아준다"…부천 치안 지킴이 정체는
- [유미's 픽] "카카오는 가끔 눈물을 흘린다"…주인 바뀐 싸이월드, 쌓인 빚은 어떻게?
- 강민구 변호사 "AI盲 줄면 사회 더 건강···판사때 디지털 힘 절감"