‘공룡 발소리’ 되살아났다…KAIST, 영상 맞춤 효과음 AI 개발

영상 속 물체의 무게와 속도까지 추론해 효과음을 만드는 인공지능 기술이 개발됐습니다.
한국과학기술원(KAIST)은 전산학부 오태현 교수 연구팀이 포스텍, 소니 AI와 함께 영상 속 물리적 상황을 이해해 현실감 있는 소리를 생성하는 인공지능 기술 ‘파바스(PAVAS)’를 개발했다고 오늘(26일) 밝혔습니다.
기존 영상-음향 생성 인공지능은 화면 속 사물의 형태나 장면 정보에 의존해 소리를 만들었습니다.
이 때문에 같은 물체라도 무게나 속도에 따라 달라지는 소리의 차이는 충분히 반영하지 못한다는 한계가 있었습니다.
연구팀이 개발한 기술은 영상 속 물체의 질량과 속도 같은 물리 정보를 인공지능이 추론하도록 설계됐습니다.
마치 사람이 거대한 공룡이 걸어오는 장면을 보면 물리적 특성을 무의식적으로 고려해 자연스럽게 땅이 울리는 듯한 묵직한 저주파음을 떠올리는 것과 유사합니다.
이에 따라 물체가 충돌하거나 타격 되는 장면에서 물리적 특성이 달라질 때 소리의 크기와 음색도 자연스럽게 바뀌었다고 연구팀은 설명했습니다.
연구팀은 이 기술을 증강현실(AR)·가상현실(VR) 콘텐츠, 메타버스, 로보틱스 시뮬레이션 분야 등에서 활용할 수 있을 것으로 보고 있습니다.
이번 연구는 컴퓨터 비전 분야 최고 권위 학술대회인 ‘CVPR 2026(Computer Vision and Pattern Recognition 2026)’에서 전체 논문 가운데 상위 1% 이내만 선정되는 오랄 발표 논문으로 채택됐습니다.
■ 제보하기
▷ 전화 : 02-781-1234, 4444
▷ 이메일 : kbs1234@kbs.co.kr
▷ 카카오톡 : 'KBS제보' 검색, 채널 추가
▷ 유튜브, 네이버에서도 KBS뉴스를 구독해주세요!
전동흔 기자 (east@kbs.co.kr)
Copyright © KBS. All rights reserved. 무단 전재, 재배포 및 이용(AI 학습 포함) 금지
- 정용진, 5·18 ‘탱크 데이’ 논란에 직접 사과
- 트럼프 “이란, 절대 핵무기 갖지 못할 것”…종전 협상도 다시 교착
- 코딩 못 하는 당신에게 AI가 보내는 초대장
- “외국인은 키이우 떠나라”…러시아, 대규모 공습 예고
- ‘삼전닉스 2배 추종’ 내일 출시…“손실 위험 큰 상품”
- “법인 슈퍼카 탈 땐 좋았지?”…세무조사 예고한 국세청 [잇슈 키워드]
- 논란의 약물 올림픽 ‘인핸스드 게임’…신기록은 단 1개뿐 [잇슈 SNS]
- “생일날 스벅은 좀”…카톡 선물하기 순위 하락 [잇슈 키워드]
- 근무 중 로스쿨 공부하며 상사에게 대든 경찰…“감봉 정당” [잇슈 키워드]
- [잇슈 SNS] 오랜 꿈과 아픈 아이들 위해…비행기 날개 위에서 98세 최고령 도전