米Googleは3月25日(現地時間)、新たなAI音楽生成モデル「Lyria 3 Pro」を発表した。2月にリリースした「Lyria 3」を拡張した上位版にあたり、最長約3分の楽曲生成に対応する。また、イントロ、バース、コーラス、ブリッジといった曲の構造を指定した生成や、より細かなカスタマイズが可能となる。
Googleは、Lyria 3 Proをフルレングスの楽曲生成向けに最適化したモデルと位置付ける。Lyria 3が約30秒のオーディオクリップ生成を主眼としていたのに対し、Lyria 3 Proでは最大約3分のトラック生成が可能となった。テキストプロンプトによる指示に加え、参考画像を入力して雰囲気や世界観などを反映した音楽を生成できる。出力は48kHzのステレオ音声である。
Lyria 3 Proでは、音楽的な構成や展開に関する理解が強化されたことで、楽曲の各セクションをテキストで指定でき、複雑な展開やスタイルの切り替えも扱いやすくなった。Google AI Studioでは、自然言語で曲全体を記述する「Text mode」に加え、イントロからバース、ブリッジなどを区切って組み立てる「Composer mode」を利用できる。これにより、AIに一任するだけでなく、利用者が楽曲構成をある程度設計しながら生成を進められる。
今回の発表では、GoogleがLyria 3 Proの提供先を広げ、制作ワークフローや開発基盤への組み込みを進める姿勢も示されている。
企業向けには「Vertex AI」でLyria 3 Proをパブリックプレビューとして提供する。用途としては、ゲーム向けサウンドトラックの生成や、各種クリエイティブツール、音楽・動画プラットフォームへの組み込みなどを想定する。開発者向けには「Gemini API」および「Google AI Studio」でプレビュー版を展開する。加えて、動画作成アプリ「Google Vids」にLyria 3/ 3 Proによるカスタム音楽生成を導入し、Google Workspace顧客およびGoogle AI Pro/ Ultra加入者向けに今週から提供を開始する。「Gemini」アプリでも、Lyria 3 Proによる長尺生成を有料加入者向けに提供する。Google Labsで提供する音楽制作プラットフォーム「ProducerAI」でも利用可能となる。
開発者は運用要件やレイテンシ要件に応じて、フルレングスの楽曲制作向けの最上位モデル「lyria-3-pro-preview」(Lyria 3 Pro)と、30秒クリップの高速処理や大量リクエストに最適化された「lyria-3-clip-preview」(Lyria 3 Clip)を選択できる。Lyria 3 Clipは、迅速な試作やループ音源、ソーシャル向け素材の生成などを想定したモデルである。