구글 제미나이의 진화, 이제 텍스트와 이미지로 "나만의 배경음악"까지 만든다

콘텐츠를 만들다 보면 배경음 하나 고르는 데 생각보다 많은 시간이 듭니다. 여러 음원을 비교하다 보면 집중이 먼저 끊깁니다. 이제는 이 과정을 줄일 수 있는 선택지가 등장했습니다. 문장 한 줄이나 사진 한 장이면 음악 초안까지 바로 붙습니다.

Google은 AI 앱 Gemini에 음악 생성 기능을 추가했는데요. 기반은 Google DeepMind의 Lyria 3입니다. 텍스트나 이미지를 입력하면 약 30초 분량의 음원과 가사가 함께 생성됩니다. 답을 정리해주던 AI가 이제는 콘텐츠 일부를 직접 만들어내는 단계로 확장됐습니다.

문장 한 줄, 바로 음악을 만든다

"IT 블로거가 포스팅하며 들을 노동요를 만들어줘"라고 입력하자 수십 초 만에 'Keyboard Inferno'라는 트랙이 생성됐습니다. 30초 분량 음원과 가사가 동시에 제공됐고, 808 베이스 중심의 에너제틱한 콘셉트라는 설명도 붙었습니다.

해본 건 한 줄 설명이 전부였습니다. 그런데 곡이 바로 만들어졌습니다. 완성형 음원이라기보다는 바로 써볼 수 있는 초안에 가깝습니다. 그럼에도 배경음 찾는 시간을 대체하기에는 충분했습니다.

여기서 체감이 갈립니다. 외부 음원 사이트를 오가며 검색하지 않아도 됩니다. 조건을 입력하는 순간 초안이 확보됩니다. 특히 혼자 콘텐츠를 제작하는 사용자라면 이 차이가 큽니다. 음악 선택 시간이 줄어들수록 전체 작업 리듬이 무너지지 않습니다. 이 기능은 감상용이라기보다 제작 속도를 위한 도구에 가깝습니다.

사진 한 장이면 분위기가 바뀐다

텍스트만 되는 건 아닙니다. 이미지나 영상도 입력값으로 활용할 수 있습니다. 예를 들어 야간 도시 사진을 올리면 차분하고 몽환적인 분위기의 트랙이 생성됩니다. 화면에서 느껴지는 무드를 음악으로 옮기는 방식입니다.

'나만의 배경음악'이라는 표현은 여기서 이해해야 합니다. 사용자의 취향을 장기간 학습하는 구조라기보다는, 입력한 조건을 반영해 결과를 조합하는 방식에 가깝습니다. 완전한 개인화라고 보기는 어렵습니다. 다만 매번 다른 상황을 넣을 수 있기 때문에 결과는 충분히 개인적인 경험으로 느껴집니다.

제미나이 음악 만들기, 생각보다 쉽다

만드는 방법은 복잡하지 않습니다. 프롬프트 창에서 '도구'를 누르고 '음악 만들기'를 선택하면 시작됩니다. 이후 16가지 트랙 중 하나를 고르고, 상황을 몇 줄 적으면 됩니다.

  • 약 30초 분량 음원과 자동 생성 가사
  • 텍스트·이미지·영상 입력 지원
  • 특정 아티스트 직접 모방은 제한

전문 작곡 도구처럼 세밀하게 음향을 설계하는 구조는 아닙니다. 대신 상황에 맞는 초안을 빠르게 확보하는 데 초점이 맞춰져 있습니다. 정교한 음악 작업을 원하는 사용자에게는 아쉬울 수 있습니다. 반대로 제작 속도가 중요한 사용자에게는 충분히 실용적인 기능입니다.

30초 한계, 대신 딱 맞는 용도

Lyria 3는 스타일과 템포 등 세부 요소를 조정할 수 있도록 설계됐습니다. 구글은 이전 세대보다 더 사실적이고 복잡한 구조를 구현했다고 설명합니다. 기술적 진전은 분명합니다.

다만 생성 길이는 30초입니다. 앨범용 음원을 기대했다면 짧게 느껴질 수 있습니다. 대신 숏폼 영상 배경음으로는 적절합니다. 모든 창작자를 위한 만능 도구는 아닙니다. 빠르게 쓸 수 있는 초안이 필요한 환경에 맞춰진 기능이라고 보는 편이 현실적입니다.

모방은 막고, 생태계는 넓힌다

저작권 문제는 피할 수 없습니다. 구글은 특정 아티스트를 그대로 모방하는 요청을 허용하지 않는다고 밝혔습니다. 이름을 입력하면 분위기만 참고하고, 기존 콘텐츠와 유사성은 필터로 점검합니다. 생성된 트랙에는 'SynthID' 디지털 워터마크가 삽입됩니다.

또한 유튜브 크리에이터용 AI 음악 도구 'Dream Track'에도 Lyria 3이 적용됐습니다. 텍스트, 이미지, 음악 제작을 하나의 흐름 안에서 처리하는 방향입니다. 제작은 편해집니다. 다만 플랫폼 안에서 작업이 반복될수록 의존도도 함께 높아집니다.

결국 선택은 분명해집니다. 완성형 음원이 필요한지, 아니면 작업 속도를 올려줄 배경음 초안이 필요한지, 후자라면 이 기능은 충분히 현실적인 대안이 될 수 있습니다.