소리, 바람까지..진짜같은 가상세계 만드는 AI모델 나온다

윤지혜 기자 2023. 5. 10. 08:16
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

이미지뿐 아니라 소리, 심도, 열화상, 움직임 등 6가지 정보를 결합할 수 있는 AI 모델이 나왔다.

메타는 "이미지바인드는 사진 속 물체가 어떻게 소리를 내고 3D처럼 보이는지, 얼마나 따뜻하고 추운지, 어떻게 움직이는지에 대한 전체적인 이해를 기계에 제공한다"라며 "이는 모든 유형의 데이터로부터 학습하는 멀티모달 AI 시스템을 만들기 위한 노력의 일환으로, 3D 및 IMU 센서를 결합해 몰입형 가상세계를 설계하는 등 새로운 시스템을 개발할 수 있다"라고 말했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

IT썰
/사진=메타

이미지뿐 아니라 소리, 심도, 열화상, 움직임 등 6가지 정보를 결합할 수 있는 AI 모델이 나왔다.

9일(현지시간) 메타는 새로운 오픈소스 AI 모델 '이미지바인드'(ImageBind) 연구논문을 공개했다. 이는 △시각적 데이터(이미지·비디오) △열화상(적외선 이미지) △텍스트 △오디오 △3D 심도 △관성측정장치(Inertial Measurement Units, IMUs) 등 6가지 유형의 데이터를 하나의 임베딩 공간에 결합하는 최초의 AI 모델이다.

예컨대 메타의 AI 이미지 생성 도구 '메이크어신'은 이미지바인드를 활용해 열대우림 소리나 혼잡한 시장 음성을 기반으로 이미지를 생성하는 등 오디오가 포함된 이미지를 만들 수 있다.

메타는 "이미지바인드는 사진 속 물체가 어떻게 소리를 내고 3D처럼 보이는지, 얼마나 따뜻하고 추운지, 어떻게 움직이는지에 대한 전체적인 이해를 기계에 제공한다"라며 "이는 모든 유형의 데이터로부터 학습하는 멀티모달 AI 시스템을 만들기 위한 노력의 일환으로, 3D 및 IMU 센서를 결합해 몰입형 가상세계를 설계하는 등 새로운 시스템을 개발할 수 있다"라고 말했다.

이미지바인드는 연구 프로젝트로 아직 실제 적용사례는 없다. 그러나 미 IT매체 더 버지는 이미지바인드가 "몰입형 다감각적 경험을 제공하는 생성형 AI의 미래"라며 "(이미지바인드에) 장거리 항해를 에뮬레이트(모방)해달라고 요청하면 파도 소리뿐 아니라 발밑의 갑판 흔들림과 시원한 바닷바람까지 느낄수 있게 해줄 것"이라고 평가했다.

메타는 "(이번 연구는) 기계가 다양한 형태의 정보를 동시에, 전체적·직접적으로 학습할 수 있는 인간의 능력에 한걸음 더 다가설 수 있는 접근법"이라며 "향후 촉각, 화법, 후각, 뇌 fMRI(자기공명영상) 신호와 같은 가능한 많은 감각을 연결하면 인간 중심 AI 모델이 가능해질 것"이라고 강조했다.


윤지혜 기자 yoonjie@mt.co.kr

Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?