Google DeepMind 於 25 日推出全新音樂生成模型 Lyria 3 Pro,此為 Lyria 3 發表後一個多月的重要進展。相較於前代僅支援 30 秒音軌,Lyria 3 Pro 顯著提升了 AI 音樂的生成長度,最長可達 三分鐘,並提供使用者更精準的創作控制與客製化能力,預計將為 AI 輔助音樂創作領域帶來新的突破。
事實陳述
Google DeepMind 所開發的 Lyria 3 Pro 模型,主要強化了 AI 音樂的生成時長與精細化控制。這項新模型能讓創作者產出長達三分鐘的 AI 音樂作品,大幅超越 Lyria 3 僅能生成 30 秒音軌的限制。其核心優勢在於對音樂結構的理解更為深入,使得使用者能透過提示詞(prompt)精確指定音樂的各個組成部分,例如前奏、主歌、副歌,以及連接主歌與副歌的橋段(bridge)等,提升了創作的自由度與精準性。
創作控制與技術細節
Lyria 3 Pro 的設計旨在提供使用者更細膩的創作工具。在技術層面,Google 強調此模型是透過合作夥伴提供的資料,以及來自 YouTube 與 Google 的合法資料進行訓練。此訓練過程確保模型不會直接模仿特定歌手的風格。然而,若使用者在提示詞中明確指定某位歌手,系統將會從該歌手的特質中汲取靈感,進而生成具備相似氛圍的音樂。此外,所有透過 Lyria 3 和 Lyria 3 Pro 創作的音樂作品,皆會自動嵌入 SynthID 數位浮水印,以明確標示其為 AI 生成內容,確保作品來源的透明度。
應用整合與模型特性
Lyria 3 Pro 的音樂生成能力已導入 Google 旗下的 Gemini 應用程式,讓使用者能夠在 Gemini 中直接體驗這項進階功能。這項整合使得 AI 音樂的創作過程更為便捷。模型在處理歌手風格指令時,採取的是「取得靈感」而非「模仿」的策略,這有助於在尊重原創性的同時,擴展 AI 輔助創作的可能性。此舉亦反映了 Google 在發展 AI 技術時,對於版權與倫理規範的考量。
後續觀察
隨著 Lyria 3 Pro 的推出,AI 音樂生成技術已從短片段的實驗性應用,邁向更具完整結構與創作潛力的長篇作品。這不僅為專業音樂人提供了新的創作輔助工具,也讓一般使用者有機會探索更複雜的音樂創作。未來,這類模型在音樂產業的應用廣度與深度,及其對音樂創作流程的影響,將是業界持續關注的焦點。