日本テレビ放送網は今年、バカリズムさんがMCを務める音楽番組『バズリズム02』が贈るライブイベント「バズリズムLIVE」が10回目を迎えることを記念し、生成AIを活用したサービスを開発した(イベント期間中の提供のため、現在は提供終了)。
そのサービスとは、バカリズムさんのイラストを学習させた画像生成モデルを活用し、入力したプロンプトの内容に従って、“バカリズム風”のイラストを生成してプレゼントするというもの。
生成AIを活用するにあたり、どのようなシステムを構築し、どのような工夫を行ったのか。社内活用ではなく、一般の人に生成AIを活用したサービスを提供するとなると、相当の苦労があったのではないだろうか。
今回、日本テレビ放送網 DX推進局 ICTエンジニアリング部 兼 サイバーセキュリティ事務局の豊田睦氏に同サービスの開発秘話をうかがった。
生成AIであなただけの一枚を作成
豊田氏は局内R&Dチームに所属しており、これまで、生成AIを活用した社内向けチャットボット「FACTly-Mate」の開発、汐留サマースクールにて画像生成AIを活用した「みらいカメラ」を企画・開発を行ったという経験を持つ。
そうした中、「バズリズムLIVE」が10回目を迎えることで、豊田氏から番組チームに「デジタル施策に取り組んでみませんか」と声をかけたそうだ。これをきっかけに、番組チームとのディスカッションが始まった。
いろいろな案が出てきたが、バカリズムさんが毎回、番組でゲストにちなんだイラストを描いており、イラストがギャラリーで楽しまれていることから、「それをAIに学習させてあなただけの一枚を作ったら面白いのではという話になりました」と、豊田氏は話す。
実際、前田直敬「バズリズム」担当プロデューサーがバカリズムさんにアイコンを描いてもらって喜んでいたとのこと。バカリズムさんが番組で描いてきたイラストは約400点に上るという。
そこで、Huluで独占配信されていた「バズリズム LIVE -10th Anniversary- 」において、有料配信チケットを購入した人に同サービスを提供することにした。メールで届いたクーポンコードを入力して、プロンプトに入力すると、生成された5枚のイラストから1枚ダウンロードできる(なお、「バズリズム LIVE -10th Anniversary-」の配信は終了している)。
「チケットを買っていただいた方には、前田プロデューサーの体験を疑似体験していただきました」と豊田氏はいう。
AWS Prototyping Programでインフラ構築の時間を短縮
なぜ、豊田氏は生成AIを活用したサービスを開発しようとしたのだろうか。同氏は「汐留サマースクールの経験で、画像生成AIでやれることがわかっていました」と話す。
サービスはAmazon Web Services(AWS)の生成AIサービス「Amazon Bedrock」を使って構築されており、同社のAWS Prototyping Programを活用した。これは、AWSのエンジニアが、顧客に代わりシステムのプロトタイプを開発するプログラム。同プログラムの活用により、要件定義から開発まで約2カ月で完了したという。
AWSによると、Prototyping Programでは、お客様の斬新なアイデアを、AWSのエンジニアが最新のモダンアーキテクチャで形にしていくという。豊田氏のアイデアは、エンタメ領域での生成AI活用、つまり「面白さのための生成AI活用」という点が受け、採用されたのだそう。
Prototyping Programのおかげで、豊田氏はAIの精度を上げることに集中することができた。このサービスの肝となるのは「いかに、バカリズムさん風のイラストをユーザーに届けることができるか」だ。すなわち、豊田氏はサービスの開発者として、最も重要であるポイントに力を注ぐことができたというわけだ。
入力プロンプト、ファインチューニング、高速画像生成における工夫
同サービスの開発においては、入力プロンプト、ファインチューニング、高速画像生成において、以下のような工夫が行われた。
入力プロンプトの裏側
LLMはClaude3.5 Sonnetが選択された。その理由について、豊田氏は「文字数の制限があるLLMもある中、入力できるリストの長さが決め手となりました。また、日本語で対応できるも大きなポイントでした。Claude3.5は日本語に強いと言われています」と説明した。AWSの講習会では、Claude3.5のプロンプトなどのノウハウを教えてもらったという。
入力したプロンプトは、Claude3.5 Sonnetを用いて、出演アーティストの出力、NGワード判定、著作権関連、公序良俗に反するお題入力の防止などのモデレートが実施された。
ファインチューニングの裏側
ファインチューニングとしては、番組内で描かれたイラストをもとにLoRAを活用して追加学習モデルを構築した。学習枚数、学習回数、Epoch数、STEP数をチューニングしながら、“バカリズム風”を保ちつつ、自由度の高いイラストを生成できるLoRAを模索したという。
豊田氏は、「チューニングのクオリティはプロデューサーの方に判断いただきました。その時、AIが勝手に画像を作るので、バカリズムさんに損にはならないようにしたいと言われました。そこで、学習元の画像が多少不気味でもマイルドな画像が生成されるようにチューニングを行い、何度も確認いただきました」と話す。
バカリズムさんに失礼がないような形で“バカリズム”風を追求するため、豊田氏はチューニングに全力を注いだ。
高速画像生成の裏側
コンシューマー向けサービスではスピードも問われる。どんなによいサービスでも、あまり待たせると、ユーザーの満足度も下がってしまうからだ。
当初、GPU付きAmazon EC2インスタンスで画像生成をしようと設計していたところ、画像の生成速度とコストの面が課題となったという。そこで、機械学習プラットフォーム「Amazon SageMaker」上で推論に最適化されたAIアクセラレーター「AWS Inferentia(第2世代)」を使うことにした。
これにより、生成速度が43%短縮し、時間当たりのコストも36%削減したという。1ユーザー当たり15.9秒で画像が生成できるようになり、「サービスとしてはかなり速いです」と豊田氏はいう。
そのほか、画像という著作権が関わるコンテンツを扱うだけに、権利関係についても努力した。例えば、バカリズム風”の追加学習に関しては、バカリズムさんにも事前に施策の実施について了解を得て進行した。また、生成に関しては、社内の「生成AI利用ガイドライン」を遵守しているほか、サービス展開時は、個別にライツ部門と確認して進める取り決めをしたそうだ。
サービス成功の秘訣は「円滑な社内連携」
サービスを提供してみて、「かなり多くの人に楽しんでもらえました。皆さん、自分のオリジナルプロンプトを入力されていましたが、アーティスト名を入力された方もいました。事前に、われわれでしかできないチューニングで備えていたので、著作権違反は回避できました。例えば、著作権問題に抵触するようなプロンプト入力にはNGメッセージを返すよう実装していました」と豊田氏は話す。
ちなみに、「猫」という持ち歌があるDISH//が出演したこともあり、プロンプトの約10%が猫を占めたという。
サービスが成功した秘訣について、豊田氏は円滑な社内連携を挙げる。「バズリズムライブ、Hulu、DX推進局と3つの事業主体がいましたが、円滑なコミュニケーションを心掛けました。生成AIは安直に取り組める領域ではありませんが、リスクを伝えていたので、理解いただけました」と話す。
また、今回のサービスを開発してみて、「企画自体にやりがいもありましたが、サービスを知った方から問い合わせ受ける機会が増え、ありがたく感じました」と豊田氏。
「テレビ局にはさまざまなアセットがあるので、やる気になればいろんなサービスを展開できます。事例があると、次のプロジェクトがやりやすくなります。これからも生成AIに取り組んでいきたいです」と、次の新たなプロジェクトに闘志を燃やす豊田氏。
実は、AWSのPrototyping Programに生成AIを用いた別のプロジェクトを申し込んでいるそうだ。「Prototyping Programを利用したことで、いろんな技術を取り入れて 開発のスピーディーにできたということで社内でも反響は大きかったです」と豊田氏は話す。
AWSの生成AIサービスのメリットを生かすことで、豊田氏はこれからも日本テレビならではの生成AIサービスを次々と世に送り出していきそうだ。