구글 Lyria 3 Pro로 3분짜리 곡을 뽑아봤더니 — Suno v5와 장르 5개로 맞붙은 결과

Gemini vs Suno AI 음악 프롬프트 비교

구글이 Lyria 3 Pro를 공개했어요. 지난달 나온 Lyria 3가 30초짜리 클립만 뽑아내서 "이걸로 뭘 하라는 건지" 싶었는데, Pro 버전은 최대 3분 길이의 완성된 트랙을 만들어냅니다. 30초와 3분은 기술적으로도 다르지만, 쓸모 차원에서 완전히 다른 물건이에요. 30초는 효과음이고 3분은 곡이니까요.

근데 진짜 중요한 건 길이가 아닙니다. Lyria 3 Pro의 킬러 피처는 구조적 작곡 인식이에요. 프롬프트에 인트로, 버스, 코러스, 브릿지 같은 곡 구성을 직접 지정할 수 있고, 모델이 이걸 실제로 반영해서 일관된 구조의 음악을 생성합니다. 기존 AI 음악 도구들은 대체로 분위기만 지정하면 알아서 구성을 짜줬는데, Lyria 3 Pro는 작곡가가 곡의 뼈대를 직접 잡을 수 있게 해준 거예요.

거기에 정확한 BPM 지정(템포 컨디셔닝), 가사가 시작하고 끝나는 시점을 제어하는 가사 타이밍 기능, 사진 한 장을 넣으면 그 분위기에 맞는 음악을 뽑아주는 Image to Music 기능까지 들어갔어요. 스펙만 보면 꽤 무시무시합니다.

Gemini 안에서 채팅으로 작곡하기

사용법은 생각보다 단순해요. Gemini에 접속해서 '도구' 메뉴의 '음악 만들기'를 선택하면 됩니다. 단, Lyria 3 Pro를 쓰려면 모델 선택을 반드시 'Pro'로 해야 해요. 이걸 놓치면 이전 버전의 Lyria로 생성되는데, 최대 길이도 짧고 곡 구성 인식도 안 되거든요. Pro를 골라야 3분짜리가 나옵니다.

요금제별 생성 한도도 꽤 명확하게 나뉘어요. Plus(하루 10곡), Pro(하루 20곡), Ultra(하루 50곡). 무료 플랜에서는 아예 사용 불가입니다. (Suno 연간 구독 해놓은 사람 입장에선 다행이라고 해야 할지, 아쉽다고 해야 할지 애매한 상황.)

프롬프트 작성이 막막하다면 꿀팁이 하나 있어요. Gemini든 ChatGPT든, "클래식 장르 음악을 만들 프롬프트를 작성해줘"라고 시키면 돼요. AI로 AI 음악 프롬프트를 만드는 건데, 이게 생각보다 잘 됩니다. 실제로 이번 비교에 쓴 5개 프롬프트도 전부 언어모델의 도움을 받았어요. 장르, BPM, 악기 구성, 분위기까지 구체적으로 뽑아줘서, 음악 용어를 몰라도 충분히 쓸 수 있더라고요.

5가지 장르, 같은 프롬프트로 맞붙인 결과

같은 프롬프트를 Lyria 3 Pro와 Suno v5에 각각 넣어봤어요. 장르 5개 — 클래식, R&B 소울, 힙합, Lo-fi, K-Pop. 결과가 꽤 갈렸습니다.

클래식(Orchestral) — D단조, 첼로 솔로 인트로로 시작해서 풀 스트링 앙상블로 빌드업되고, 팀파니 롤이 깔린 브라스 코러스로 터지는 구성. 72 BPM, 산 위의 일출 같은 영화 음악을 요청했어요. Lyria Pro는 'First Light on the Ridge'라는 2분 26초짜리를, Suno v5는 'Dawn Over the High Peaks'라는 4분 12초짜리를 내놨습니다. 길이부터 Suno가 거의 두 배.

R&B 소울 — Ab 메이저, 85 BPM, 따뜻한 로즈 피아노 인트로에 실키한 여성 보컬, 90년대 네오소울 감성을 요청했더니 Lyria Pro 2분 51초, Suno v5 3분 24초. 힙합 — C단조, 140 BPM, 트랩 스타일 808 베이스에 하이햇 롤, 다크 피아노 루프, 오토튠 보컬까지 지정했어요. Lyria Pro 2분 28초, Suno v5 3분 45초. 힙합에서 Suno의 강점이 가장 도드라졌습니다.

Lo-fi — F 메이저, 75 BPM, 비닐 크랙 인트로에 재즈 기타 루프, 붐뱁 드럼, 빗소리 앰비언스. "심야 공부용, 보컬 없음"까지 세세하게 지정했어요. Lyria Pro 2분 57초, Suno v5 2분 12초. 여기서만 Lyria가 더 길었습니다. (Lo-fi 장르에서 Lyria가 의외로 선전했어요.)

K-Pop — Bb 메이저, 128 BPM, 신스 아르페지오 인트로에 스타카토 보컬 촙, EDM 스타일 코러스 드롭, 브라스 스탭까지 넣은 페스티벌용 댄스 트랙. Lyria Pro 2분 37초, Suno v5 2분 44초. 여기선 길이가 비슷했는데, 문제는 퀄리티 차이였어요.

숫자만 봐도 패턴이 보이죠. 5개 장르 중 4개에서 Suno가 더 긴 트랙을 생성했어요. 생성 길이가 곧 품질은 아니지만, 더 긴 트랙을 만든다는 건 곡의 구조 — 인트로, 버스, 코러스, 브릿지, 아웃트로 — 를 더 풍부하게 구성했다는 뜻이기도 합니다. 클래식에서 4분 12초 트랙을 만들었다는 건, 하나의 테마를 발전시키고 변주까지 넣었다는 얘기거든요.

Suno 연간 구독자가 안심해도 되는 이유 (아직은)

솔직한 감상부터 말하자면, Suno 쪽이 더 나았어요. 프롬프트에 담긴 의도 — BPM, 악기 구성, 분위기 — 를 더 정확하게 반영했다는 느낌이 확실히 들었습니다. 특히 힙합과 R&B처럼 보컬이 들어가는 장르에서 차이가 크더라고요. 지금 시점의 Lyria Pro는 솔직히 Suno v4 정도의 퀄리티로 느껴졌어요. 물론 Suno v5는 유료 구독자만 쓸 수 있는 모델이니까, 비교 대상이 좀 불공평하긴 합니다.

"Suno 1년 연 구독을 해뒀는데 어떡하지"라는 생각이 제일 먼저 들었는데, 결과물을 들어보니 다행히(?) 아직은 괜찮더라고요. 근데 이게 시간문제예요. 공개된 것이 이 정도면, 구글 내부에선 이미 더 좋은 버전이 돌고 있을 테고, 몇 달 안에 퀄리티를 끌어올리는 건 예상 가능한 수순이잖아요.

저작권과 워터마크 — 구글이 깐 안전장치

기술적 비교 외에 짚어야 할 게 있어요. 구글은 Lyria 3를 "유튜브와 구글이 서비스 약관, 파트너 계약, 법률에 따라 사용할 권리가 있는 자료"로 학습시켰다고 밝혔어요. 특정 아티스트를 모방할 수 없고, 프롬프트에 아티스트 이름을 넣어도 넓은 영감 수준으로만 반영됩니다. Suno도 특정 아티스트 이름은 프롬프트에 사용할 수 없게 막아뒀고요.

여기에 구글은 SynthID 워터마크를 모든 Lyria 생성 음악에 삽입합니다. 사람 귀에는 안 들리지만 AI 생성 여부를 기술적으로 식별할 수 있는 장치예요. 이미지 생성 모델에도 적용되어 있는 기술이고, 이전에 나노 바나나로 생성된 이미지에서도 SynthID가 작동하고 있었죠. 저작권 분쟁이 터졌을 때 "이건 AI가 만든 겁니다"를 증명할 수 있는 일종의 보험이에요. 음악은 이미지보다 저작권 분쟁 가능성이 훨씬 높으니까, 구글 입장에선 이 워터마크가 필수적이었을 거예요.

만들기가 쉬워질수록 듣기가 어려워진다

AI가 3분짜리 곡을 채팅 한 번으로 뽑아내는 세상이에요. 제작 비용이 0에 수렴하면 뭐가 달라질까요?

음악의 가치가 '만드는 행위'에서 '듣는 경험'으로 이동합니다. 좋은 스피커가 있는 오프라인 공간에서 음악을 감상하는 것, 콘서트에서 라이브로 듣는 것 — 이런 경험의 가치가 올라갈 수밖에 없어요. AI가 30초 만에 클래식 한 곡을 만들어낼 수 있으면, 그 음악 자체의 희소성은 사라지잖아요. 클릭 한 번으로 만들 수 있는 것은 클릭 한 번으로 소비되고 잊혀요. 클릭으로 만들 수 없는 것만 살아남습니다. 결국 라이브.

Lyria 3 Pro는 아직 Suno를 넘지 못했어요. 근데 구글이 30초짜리를 3분으로 끌어올리는 데 걸린 시간이 고작 한 달이었다는 걸 생각하면, 다음 한 달 뒤에는 어떨지. Suno 연간 구독권의 유효기간이 남아 있는 동안은 괜찮겠지만, 갱신할 때쯤엔 다시 고민해봐야 할 거예요.