[LAB을 찾아서]음성·음향 인공지능 기술 선도…장준혁 한양대 교수 연구팀

장준혁 한양대 융합전자공학부 교수 연구팀이 세계 음향 인공지능(AI) 챌린지인 ‘IEEE DCASE 2023 Challenge’ 오디오 생성 부문에서 우승을 차지했다.

장준혁 한양대 교수(맨 왼쪽)와 음성음향신호처리 및 머신러닝 연구실 구성원들.[사진제공=한양대]

장 교수팀은 전 세계 14개 팀이 28개 시스템을 제출한 '오디오 생성부문'에서 우승을, 10개 팀이 29개 시스템을 선보인 '자동 오디오 캡셔닝' 부문에서 준우승을 각각 차지했다. 특히 오디오 생성 분야에서 사용한 기술은 생성형 AI 기술에서 떠오르고 있는 디퓨전 기반의 기술과 대표적인 생성 모델인 'GAN'(Generative Adversarial Networks) 기술을 활용해 설계했다. 두 기술의 장점을 조합해 단순히 높은 품질의 오디오뿐 아니라 다양한 소리를 생성해 높은 평가를 받았다.

장 교수팀은 다양한 데이터 세트에 대한 실험, 최신 딥러닝 알고리즘 도입 등 활발한 연구를 통해 음성·음향 분야 발전에 힘쓰고 있다. 장 교수가 이끄는 음성음향신호처리 및 머신러닝 연구실은 딥러닝 기반의 음성, 음향, 신호처리 등 다양한 연구를 수행한다. 세계적으로도 보기 드문 대규모 연구실로 박사과정 25명과 석사과정 17명, 인턴 5명으로 구성돼 있다. 이들은 음성인식, 음성합성, 화자인식, 신호처리 등 연구 분야에 따라 팀을 이뤄 연구를 진행한다. 특히 음성 오디오 AI 분야의 국제 최정상 학술대회로 인정받는 'ICASSP', 'INTERSPEECH'에 다수의 논문을 게재함으로써 연구실의 역량을 입증했다. 이밖에 삼성전자, 현대자동차 등 국내 유수 기업들과 소통하며 산학과제, 세미나 등을 꾸준히 진행하고 있다.

현재 세계적으로 음성·음향 분야 AI 기술 개발 연구가 활발히 이뤄지고 있다. 인간의 일을 대체하기 위해서는 AI와 인간과의 커뮤니케이션이 필수이기 때문이다. 오픈AI, 구글, 마이크로소프트 등 글로벌 기업들이 챗GPT와 같은 데이터 학습 모델을 선보이고 투자하는 이유다. 장 교수는 "내년 서울에서 개최되는 음성 AI 분야의 국제 저명 학회 ‘ICASSP 2024’를 위해 연구실 학생들이 의기투합해 논문 작업에 매진하고 있다"며 "앞으로도 최신 기술 트렌드를 빠르게 습득하고, 국내뿐 아니라 세계적으로도 경쟁력을 갖춘 연구자를 배출하는 연구실로서 끊임없이 노력할 계획"이라고 말했다.

임춘한 기자 choon@asiae.co.kr

아시아경제

사회

[LAB을 찾아서]음성·음향 인공지능 기술 선도…장준혁 한양대 교수 연구팀