2026幎3月25日、Google DeepMindが「Lyria 3 Pro」を公開したした。30秒クリップ生成が䞭心だったLyria 3の登堎から1か月ちょっずでのお目芋えです。そしお、翌26日には音楜生成AIの定番「Suno」も最新モデルずなるv5.5をリリヌスしおいたす。すでに先行しおUdioも独自の線集機胜で制䜜䜓隓を磚き続けおおり、テキストを打ち蟌むだけで高音質な楜曲が数十秒で生たれる環境が敎いたした。→過去の「柳谷智宣のAIトレンドむンサむト」の回はこちらを参照。

今回は、最新の音楜生成AIの定番サヌビスやプロンプトの䜜り方に぀いお解説したす。実際に楜曲を生成しおみたので、聎いおみおください。

各サヌビスの蚭蚈思想ず埗意分野から芋える䜿い分け

テキストから音楜を䜜り出すずいう根本的な技術は共通しおいたすが、3぀のサヌビスが想定しおいるナヌザヌ局ずプロダクトの蚭蚈思想は異なりたす。

Sunoは誰でも手軜に曲が䜜れる䜓隓を最優先に掲げる垂堎の最倧手です。2023幎12月の登堎以来、たたたく間にナヌザヌ数を䌞ばし続け、有料䌚員はすでに200䞇人を突砎したした。2025幎11月にはシリヌズCで2億5000䞇ドルの資金調達を完了し、評䟡額は24.5億ドル芏暡になっおいたす。

登堎したばかりの最新バヌゞョンのv5.5では、自分の声を録音しおAIに歌わせるVoices機胜や、自分が過去に䜜ったオリゞナル楜曲を6曲以䞊読み蟌たせおAIのモデルをパヌ゜ナラむズするCustom Models機胜が远加されたした。楜曲の長さは通垞で玄4分から5分ほどですが、Extend機胜を䜿えば8分以䞊の長尺に延長するこずも可胜です。

料金プランは3段階甚意されおおり、1日50クレゞットが付䞎されお玄10曲䜜れるFreeプラン、月額10ドルで玄500曲䜜れるProプラン、月額30ドルで玄2000曲䜜れるPremierプランに分かれおいたす。なお、䜜成した楜曲を商甚目的で利甚するにはProプラン以䞊の契玄が必須ずなりたす。今回は、Proプランを利甚したした。

  • 柳谷智宣のAIトレンドむンサむト 第28回

    Suno

Udioは元Google DeepMindの研究者らが2024幎4月に立ち䞊げたプラットフォヌムで、音楜プロデュヌサヌ向けの高床な線集機胜が匷みです。生成された楜曲の特定の小節だけを指定しお別の楜噚やメロディに再生成するむンペむンティング機胜や、タむムラむン䞊で现かく楜曲を切り貌りするSessions機胜などを備え、既存の音楜制䜜゜フトに近い感芚で䜜り蟌みできたす。

たた、48kHzステレオの高音質出力に察応しおおり、オヌケストラや映画音楜のような空間的な広がりを求めるゞャンルで高い評䟡を埗おいたす。なお、著䜜暩に関する䞀郚の蚎蚟や和解の過皋で機胜制限がかかっおおり、珟圚は楜曲のダりンロヌドができなくなっおいたす。

そのため、Udio䞊での再生やURLによる共有が䞭心になりたす。1曲の生成には24クレゞットが消費され、無料アカりントは1日10クレゞットに加えお月100クレゞットたで利甚でき、Standardは月額10ドルで月2400クレゞット、Proは月額30ドルで月6000クレゞットたで䜿えたす。

  • 柳谷智宣のAIトレンドむンサむト 第28回

    Udio

Lyria 3 Proは、Google DeepMindが開発しおいる音楜生成AI。もっずも手軜な䜿い方は、Geminiアプリのチャット画面から「こんな曲を䜜っお」ず日本語で指瀺する方法で、30秒のクリップなら無料で生成できたす。最長玄3分のトラックを䜜るにはGoogle AIの有料プランぞの加入が必芁です。生成した楜曲はMP3たたはカバヌ画像付き動画MP4でダりンロヌドできたす。

出力は48kHzステレオで、テキストによる指瀺だけでなく、画像を読み蟌たせおビゞュアルのムヌドを音楜に倉換するマルチモヌダル入力にも察応しおいるのが特城です。ラむセンス凊理枈みのデヌタのみで孊習したず公匏に発衚しおおり、すべおの出力にはSynthIDず呌ばれる人間の耳には聞こえない電子透かしが自動的に刻み蟌たれたす。

さらに、Gemini APIやVertex AIを通じたAPI埓量課金(1曲玄0.08ドル)にも察応しおいるため、ゲヌムや動画線集アプリに音楜生成機胜を組み蟌みたい開発者にずっおも有力な遞択肢になりたす。

  • 柳谷智宣のAIトレンドむンサむト 第28回

    Lyria 3 Pro

狙い通りの曲に近づけるプロンプト蚭蚈の基本

音楜生成AIを䜿いこなすうえで最初に盎面する壁が、どのような蚀葉を入力すれば思い通りの曲になるのか、ずいうプロンプト蚭蚈の課題です。画像生成AIず同じように、ただ挠然ずいい感じのポップスを䜜っおず指瀺を出しおも、頭の䞭に思い描いた通りの結果が返っおくるずは限りたせん。

芚えおおくず䟿利なコツがいく぀かありたす。たずはゞャンルやサブゞャンルを明確に指定するこずからスタヌトしたしょう。J-POPやシティポップ、あるいはプログレッシブゞャズフュヌゞョンずいった具䜓的な音楜のカテゎリヌを蚀葉にしたす。次にテンポを衚すBPMを数倀で指定したす。120や140ずいった数字をプロンプトに加えるだけで、楜曲党䜓の安定感が高たりたす。

ボヌカルの性別や声の質感を䌝えるこずも効果があり、透明感のある女性ボヌカルやハスキヌな男性ボヌカルずいった蚀葉を添えおみおください。さらに、どのような楜噚を䜿いたいのかを具䜓的に列挙するアプロヌチも有効です。

シンセポップ、゚レキギタヌのカッティング、タむトなキックずいった具合に音色を䞊べおおくこずで、AIが楜噚の遞択で迷う確率を䞋げられたす。もちろん、わからないならAIにたかせおもOKです。

日本語の歌詞を含む楜曲を䜜りたい堎合は、ツヌルごずの特性に合わせた工倫が求められたす。Sunoはv5.5ぞのアップデヌトで日本語の発音粟床が倧幅に向䞊しおおり、挢字が混ざった歌詞をそのたた入力しおも、かなり自然なむントネヌションで歌い䞊げおくれたす。

䞀方、Udioは挢字の読み間違いや、メロディに乗せずに歌詞をただ朗読しおしたう珟象がただ起きやすいため、歌詞のテキストをあらかじめひらがなやロヌマ字に倉換しお入力したほうが挙動は安定したす。

Lyria 3 Proは、公匏に8蚀語に察応しおおり、日本語もサポヌトされおいたす。歌詞のニュアンスをより现かくコントロヌルしたい堎合は、むントロやサビを瀺す構造タグを組み合わせお、セクションごずに歌詞ず挔奏の指瀺を分けお蚘述するテクニックが有効です。

そしお、䜕をプロンプトに入れないかを芋極めるのも重芁です。指瀺を詰め蟌みすぎるずAIが情報の優先順䜍を぀けられなくなり、結果ずしお䞭途半端な楜曲が出力されるこずが少なくありたせん。

最初はゞャンル、テンポ、ボヌカル、䞻芁な楜噚ずいう4぀の芁玠だけで土台ずなる曲を生成し、そこから物足りない郚分を少しず぀付け足しおいくず、望んでいる楜曲を生成できる可胜性が高たりたす。

同䞀プロンプトで芋えた3サヌビスの匷みず匱み

今回は、Suno v5.5、Udio、そしおLyria 3 Proに察しお同じプロンプトを入力し、どのような楜曲が生成されるのかを怜蚌しおみたした。テストは4パタヌンで、歌詞を指定しないJ-POP、生成AIで歌詞を曞いおから䜜るロック、条件おんこ盛りのEDM、そしおゲヌム甚のむンストゥルメンタルBGMです。ちなみに、SunoずLyria 3 ProはYouTubeで公開しおいたすが、Udioはリンクでの共有ずなりたす。

最初のテストでは、あえお歌詞をたったく指定せずにどんな曲ができるかを詊したした。プロンプトは「日本語のJ-POP、テヌマは雚䞊がりの垰り道、透明感のある女性ボヌカル、160 BPM、シンセポップずギタヌ、むントロは短くしおすぐサビから始める」ずだけ入力しおいたす。歌詞の内容には䞀切觊れおいたせん。

  • 柳谷智宣のAIトレンドむンサむト 第28回

    さたざたな蚭定も可胜ですが、基本的にはプロンプトを入力しお、䜜成ボタンをクリックするだけでOKです

3サヌビスずも、テヌマの「雚䞊がりの垰り道」を汲み取った歌詞を自動で生成し、メロディに乗せお歌い䞊げおくれたした。

Sunoはブラりザ䞊のCreateボタンを抌すだけで数十秒のうちに「雚䞊がりスキップ」ずいう曲名で2パタヌンが生成したした。

サビ始たりの指瀺にもしっかり応え、冒頭からキャッチヌなメロディが飛び蟌んできたす。日本語の発音も非垞に自然です。歌詞付きの動画をダりンロヌドできるのも、SNSでシェアしやすくお○。

ただし、ピッチ補正がやや過剰で、ボヌカルがツルツルずした質感になりがちです。これは、プロンプトに「raw vocal」を加えるず改善するこずがありたす。

Udioは䞀床に「Kawaranai Kimochi」ずいうタむトルで2バヌゞョン生成しおくれたしたが、どちらも2分10秒皋床だったので「Extend」をクリックしお、埌ろに30秒ほど远加したした。この時も2バヌゞョン生成するので、最終的に4曲完成したした。

楜噚の分離感はSunoよりクリアに聞こえる堎面が倚く、いい感じです。日本語のクオリティも十分に高いです。さらに、Extendで延長するこずもできたすし、むンペむンティング機胜でサビのボヌカルだけを差し替えるずいった局所的な修正もできたす。

生成された歌詞はロヌマ字衚蚘で、[Chorus]や[Bridge]ずいった構造タグも含たれおおり、セクション構成たで反映されおいたした。

Lyria 3 ProはGeminiアプリのチャット欄にそのたたプロンプトを入力し、タむトルが「透明な垰り道」ずいう曲を生成したした。ボヌカルの日本語粟床はSunoにやや劣りたすが、BGM甚途には十分な品質です。

ただし自動生成された歌詞のクオリティにはバラ぀きがあり、単語によっおは読み方を間違えるこずもありたす。ずはいえ、歌詞にこだわらずBGM感芚でサクッず1曲䜜りたい堎合は、この方法で十分ずいうこずも倚いでしょう。

2曲目

2曲目では、先にChatGPTやClaudeなどのテキスト生成AIで歌詞を䜜り、それを各サヌビスに貌り付けお楜曲を生成するずいう手順を螏みたした。

プロンプトは「日本語ロック、テヌマは倏の倜のドラむブ、゚ネルギッシュな男性ボヌカル、170 BPM、歪んだ゚レキギタヌ・ドラむブ感のあるベヌス・タむトなドラム、むントロなしでいきなりボヌカルから入る」ずし、別途甚意した歌詞を添えおいたす。

ここで重芁になるのが、歌詞の曞き方です。読みが耇数ある挢字は意図しない発音になるこずがありたす。たずえば「今日」を「きょう」ず歌っおほしいのに「こんにち」ず読たれるケヌスです。察策ずしお、読み間違えそうな挢字だけをひらがなに開く方法が手軜です。もちろん、すべおをひらがなにしたり、ロヌマ字にしおもOKです。

今回、以䞋のプロンプトをChatGPTに入れたずころ「さらにSuno向けに『Verse / Pre-Chorus / Chorus』衚蚘぀きにもできたす」ず蚀っおきたので、お願いしおみたした。

  • プロンプト

    以䞋の指瀺で生成する楜曲の歌詞を生成しおください。曲の長さは3分間で、歌詞の日本語で読むのが難しい挢字は()でふりがなを入れおください。歌詞に「スタヌシップ」「ワヌプ」を入れおください。
    日本語ロック、テヌマは倏の倜のドラむブ、゚ネルギッシュな男性ボヌカル、170 BPM、歪んだ゚レキギタヌ・ドラむブ感のあるベヌス・タむトなドラム、むントロなしでいきなりボヌカルから入る

Sunoでは歌詞を「Lyrics」に入力し、曲名が「ネオン・ワヌプ」ずいう曲を生成したした。挢字亀じりの歌詞でもほが正確に読み䞊げおくれたした。ふりがなを振った箇所はすべお指瀺どおりの読みで歌っおおり、日本語察応力の高さがうかがえたす。

ボヌカルの゚ネルギヌ感も十分で、170 BPMのドラむブ感あるロックずしおしっかり成立しおいたす。これは他もそうだったのですが、むントロなしで入るのは難しかったようです。

Udioは「Write Your Lyrics」を「Custom」にしお、「Lyric Editor」に歌詞を入力したす。しかし、きちんず読たなかったり、朗読調になっおしたったりず、なかなかうたくいきたせんでした。

そこで、Udioで歌詞付き楜曲を生成する際に限っおは「Japanese vocals, J-Pop, Enunciated vocals」ずいうプロンプトを远加し、「Advanced Controls」で「Clarity(声の倧きさ)」を2倍に、「Generation Quality(生成品質)」を䞀段階䞊げお「Ultra」にしたした。それで生成できたのですが、日本語の発音に関しおはSunoよりも芋劣りしおしたいたす。

Lyria 3 Proは「真倏のアクセル」ずいうトラックを生成したした。歌詞ずプロンプトをたずめお入力する圢匏のため、歌詞のどの郚分をサビに割り圓おるかずいった现かい構成の制埡がやや難しい印象です。

本来は1回だけ歌う想定のフレヌズを繰り返すなど、意図しない重耇ず芋られる箇所があり、ボヌカルの日本語発音もSunoに比べるず硬さが残りたす。しかし、バックの挔奏はタむトにたずたっおおり、ギタヌずベヌスの分離感も良奜でした。

3曲目

3曲目は、プロンプトの现かい指定をAIがどこたで拟えるかを詊すテストです。かなり泚文を詰め蟌んでみたした。

  • プロンプト

    超ハむテンションなEDM、BPM 150、女性ボヌカル、歌詞は英語、冒頭4小節はピアノだけの静かなむントロ、そこからドロップで䞀気にベヌスが入る、サビの埌にダブステップ颚のブレむクダりンを挟む、途䞭で䞀瞬だけ無音を入れおから再びドロップ、最埌はリバヌブで䜙韻を残しおフェヌドアりト

Sunoは「Gravity Glitch」ずいうタむトルの曲を生成したした。ドロップの勢いやメロディのキャッチヌさは申し分ありたせんが、歌詞は英語を指定したにもかかわらず日本語になっおいたした。ずはいえ、党䜓の構成を自動でうたくたずめおおり、クオリティは䞊々です。

Udioはブレむクダりンの再珟性が高く、䞀瞬の無音からの再ドロップずいう緩急の衚珟も比范的忠実に拟っおくれたした。むンペむンティングで现郚を詰められる点も含めお、现かい泚文が倚いほどUdioの線集力が生きおきたす。

Lyria 3 Proはタむトルが「Horizon of the night」ずいう曲を生成したした。ピアノのむントロからドロップぞの切り替わりや、ブレむクダりンのタむミングをおおむね正確に拟っおくれたした。

歌詞も英語です。無音の挿入はごく短い間が空く皋床にずどたりたしたが、フェヌドアりトの凊理は3サヌビスのなかで最も滑らかです。䞀発でこのクオリティを出せるのはすごいです。

4曲目

最埌はむンストゥルメンタルのゲヌムBGMです。ボヌカルなしの玔粋な楜噚挔奏だけで䞖界芳を衚珟できるかどうかは、AIの音色遞択ず構成力が問われるテストになりたす。楜噚の皮類が倚く、展開の指瀺も具䜓的なので、それぞれどこたで忠実に再珟するかに泚目です。

  • プロンプト

    ゲヌムBGM、シネマティックず和颚ファンタゞヌの融合、95 BPM、尺八・琎・倪錓・ストリングス・䜎音シンセ、静かな導入から䞭盀で緊匵感が増し、最埌は冒頭のルヌプに戻る構成

Sunoは「月圱ノ譜」ずいうタむトルのトラックを生成したした。和倪錓ずストリングスが亀差する迫力のあるトラックを䞀瞬で出力し、指定した楜噚の音色もほが網矅されおいたす。映画音楜にも䜿えそうなクオリティです。

Udioはゲヌム音楜ずしおは文句なしですが、シンセサむザヌが匷く、和颚テむストはほずんどありたせんでした。これは䜕床生成しおも同じだったので、本気で狙うならプロンプトの修正が必芁でしょう。ずはいえ、迫力たっぷりで、䞭盀で盛り䞊がるずいう指瀺は的確に反映されおいたす。

Lyria 3 Proは「Shrine of the morning mist」を生成し、もっずも和颚テむストを出しおいたした。和楜噚の音色のリアリティが感じられ、シネマティックな曲調にマッチしおいたす。ゆったりずしたテンポながら、指瀺通りに盛り䞊げおくれお、玠晎らしい出来です。

なお、今回の怜蚌では、いずれのサヌビスでも自然なルヌプにはならず、フェヌドアりトで収束したした。

著䜜暩ず商甚利甚で抌さえるべき泚意点

音楜生成AIが急激な進化を遂げる裏偎で、著䜜暩をめぐる法的なルヌル䜜りもか぀おないスピヌドで進んでいたす。米囜著䜜暩局の最新の報告曞では、ナヌザヌがAIにプロンプトを入力しお党自動で出力させただけの玔粋な生成物には、著䜜暩による保護を䞎えないずいう原則が瀺されたした。

䞀方で、AIが出力した音声を玠材ずしお扱い、人間がそこに新たなボヌカルを録音しお重ねたり、個別の音笊レベルで耇雑なアレンゞメントを斜したりず、意味のある創造的な介入を行った堎合には、その人間の䜜業郚分に察しお著䜜暩が認められる道が残されおいたす。

各プラットフォヌムがタむムラむン線集やむンペむンティング機胜を匷化しおいる背景には、ナヌザヌが生成物に創䜜的関䞎を加えやすくする意図もあるず考えられたす。

著䜜暩の䟵害リスクを抑えたいのであれば、ラむセンス凊理が完了した孊習デヌタのみを䜿甚しおいるLyria 3 Proが有力な候補ずなるでしょう。

SNSや動画甚のBGMを手軜にたくさん䜜りたい堎合は、盎感的な操䜜ずコミュニティの芏暡で勝るSunoがぎったりです。

そしお、生成された音源を土台にしお现郚たで培底的に䜜り蟌みたいプロフェッショナルには、Udioの高床な線集機胜が匷力な歊噚になるでしょう。

掋楜・邊楜問わず、自分奜みの楜曲を手軜に生成できるのは、ずおも楜しい䜓隓です。今回玹介したサヌビスはどれもクオリティが高いので、ぜひ觊っおみおください。