‘공룡 발소리’ 되살아났다…KAIST, 영상 맞춤 효과음 AI 개발

전동흔 2026. 5. 26. 09:49
음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

영상 속 물체의 무게와 속도까지 추론해 효과음을 만드는 인공지능 기술이 개발됐습니다.

한국과학기술원(KAIST)은 전산학부 오태현 교수 연구팀이 포스텍, 소니 AI와 함께 영상 속 물리적 상황을 이해해 현실감 있는 소리를 생성하는 인공지능 기술 ‘파바스(PAVAS)’를 개발했다고 오늘(26일) 밝혔습니다.

기존 영상-음향 생성 인공지능은 화면 속 사물의 형태나 장면 정보에 의존해 소리를 만들었습니다.

이 때문에 같은 물체라도 무게나 속도에 따라 달라지는 소리의 차이는 충분히 반영하지 못한다는 한계가 있었습니다.

연구팀이 개발한 기술은 영상 속 물체의 질량과 속도 같은 물리 정보를 인공지능이 추론하도록 설계됐습니다.

마치 사람이 거대한 공룡이 걸어오는 장면을 보면 물리적 특성을 무의식적으로 고려해 자연스럽게 땅이 울리는 듯한 묵직한 저주파음을 떠올리는 것과 유사합니다.

이에 따라 물체가 충돌하거나 타격 되는 장면에서 물리적 특성이 달라질 때 소리의 크기와 음색도 자연스럽게 바뀌었다고 연구팀은 설명했습니다.

연구팀은 이 기술을 증강현실(AR)·가상현실(VR) 콘텐츠, 메타버스, 로보틱스 시뮬레이션 분야 등에서 활용할 수 있을 것으로 보고 있습니다.

이번 연구는 컴퓨터 비전 분야 최고 권위 학술대회인 ‘CVPR 2026(Computer Vision and Pattern Recognition 2026)’에서 전체 논문 가운데 상위 1% 이내만 선정되는 오랄 발표 논문으로 채택됐습니다.

[사진 출처 : 한국과학기술원 제공]

■ 제보하기
▷ 전화 : 02-781-1234, 4444
▷ 이메일 : kbs1234@kbs.co.kr
▷ 카카오톡 : 'KBS제보' 검색, 채널 추가
▷ 유튜브, 네이버에서도 KBS뉴스를 구독해주세요!

전동흔 기자 (east@kbs.co.kr)

Copyright © KBS. All rights reserved. 무단 전재, 재배포 및 이용(AI 학습 포함) 금지