텍스트만 넣으면 원하는 음악이…뉴튠, '믹스오디오 베타' 론칭

김태현 기자 2023. 11. 9. 20:30
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

이번에 공개된 믹스오디오 베타 서비스는 레퍼런스 이미지나 오디오를 통해서도 음악을 생성할 수 있도록 멀티모달 기술을 적용한 것이 가장 큰 특징이다.

이종필 뉴튠 대표는 "아트리스트같은 거대 음원 스톡 플랫폼이 존재하지만, 여전히 원하는 음악을 찾는 일이 쉽지 않다"며 "믹스오디오를 만나면 거대하고 미로 같은 음악 창고 속을 헤메는 대신 원하는 음악을 AI로 직접 생성할 수 있어 노력과 시간을 대폭 절감할 수 있을 것"이라 전했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[이 기사에 나온 스타트업에 대한 보다 다양한 기업정보는 유니콘팩토리 빅데이터 플랫폼 '데이터랩'에서 볼 수 있습니다.]

인공지능(AI) 음악 기술 기업 뉴튠이 멀티모달(Multi Modal) 기술을 활용한 AI 배경음악(BGM) 생성기 '믹스오디오(Mix.audio)'의 베타 서비스를 시작한다고 9일 밝혔다.

이번에 공개된 믹스오디오 베타 서비스는 레퍼런스 이미지나 오디오를 통해서도 음악을 생성할 수 있도록 멀티모달 기술을 적용한 것이 가장 큰 특징이다.

멀티모달은 AI가 텍스트 뿐 아니라 이미지, 오디오 등 다양한 정보를 인식하는 것을 뜻한다. 지난 9월 오픈AI의 최고경영자(CEO) 샘올트만이 공식 블로그를 통해 '이제 챗GPT가 보고 듣고 말하게 될 것이다'라고 선언하면서 멀티모달을 재차 강조한 바 있다.

믹스오디오는 멀티모달을 음악생성 AI에 적용했다. 사용자로 하여금 원하는 음악에 대한 프롬프트 입력 외에도 음악이 필요한 씬을 이미지로 보여주거나 필요한 것과 유사한 느낌의 레퍼런스 음악을 제공하면 AI가 이를 해석해 매칭되는 음악을 생성할 수 있게끔 하였다.

이미지나 음악의 입력은 파일 혹은 링크로 가능하며 두가지 방식의 혼합 이용 가능하다. 가령 프롬프트와 함께 이미지를 입력한다거나 이미지와 레퍼런스 음원을 함께 제공하는 것도 가능하다.

또한 믹스오디오는 배경음악을 찾는 크리에이터들의 편의성을 극대화하기 위해 빠른 음악 생성 속도를 구현하고 생성된 음악의 투명한 라이센스까지 확보했다. 요청 후 음악이 생성되기까지는 3초가 채 걸리지 않아 사용자가 여러번 음악을 생성해내도 시간적 부담이 거의 없다.

베타서비스는 약 한달 간 진행될 예정이다. 이 기간 동안 사용자들은 무료로 서비스를 제한없이 이용할 수 있다. 생성한 음원을 사용하는 것에도 별도의 제약을 두지 않는다.

이종필 뉴튠 대표는 "아트리스트같은 거대 음원 스톡 플랫폼이 존재하지만, 여전히 원하는 음악을 찾는 일이 쉽지 않다"며 "믹스오디오를 만나면 거대하고 미로 같은 음악 창고 속을 헤메는 대신 원하는 음악을 AI로 직접 생성할 수 있어 노력과 시간을 대폭 절감할 수 있을 것"이라 전했다.

[머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리']

김태현 기자 thkim124@mt.co.kr

Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?