8月19日、第3回となる「エンタメ業界のデータエンジニアリング最前線」(共催:データ横丁、マイナビ)が開催された。今回のテーマは「書籍」だ。KADOKAWA デジタルマーケティング局 データマネジメント部 部長の塚本圭一郎氏とviviON マーケティング部及びコンテンツ部 ゼネラルマネージャーの谷島貴弘氏、同 開発部 SREチーム サブリーダーの早川晋矢氏が登壇。司会進行は吉村武氏が務めた。
マスターデータ内製でIPのLTV最大化
KADOKAWAでは、IPのLTV(ライフタイムバリュー)最大化を目指している。塚本氏はそのためのデータ基盤とメタデータ整備の取り組みを紹介した。
同社は現在、グループ子会社を含めて60社を超える総合エンターテイメント企業として、「グローバル・メディアミックス with Technology」を経営戦略に掲げている。「IPの原作である小説、コミックスの創出を拡大し、それをコミカライズ、ノベライズ、アニメ化、ゲーム化などのかたち(=メディアミックス)で展開し、さらにグローバル展開したり、ライツ(=権利)ビジネスのかたちにしたりすることで、息の長いコンテンツにしていく」と同氏は説明する。
こうした戦略に基づき、同社ではIPに関するマスターデータを内製で構築。これにより、アイテム単位、事業単位だけでなくIP単位での収支管理も実現している。また、メディアミックス作品の売上をさまざまな軸で確認できるダッシュボードも用意。IPのLTVを最大化する施策に対する効果を測定したり、施策考案の参考にしたりすることに使用している。
AI時代の差別化の源泉とは
ダッシュボードを支えるデータ基盤はどのようなものか。KADOKAWAではSnowflake、Amazon Redshift、Google BigQueryといったクラウドデータウェアハウスを並行運用している。塚本氏によれば、以前はTreasure Dataも使用していたが、統合したという。さらなる統合を進めたい意向はあるものの、「費用対効果の観点からなかなか難しく、しばらくは3つ並行して運用することにした」(塚本氏)そうだ。
基盤構成のコンセプトは「SaaSを組み合わせたコンポーザブル型のデータ基盤構成」。つまり、「特定のクラウドベンダー一色にするのではなくて、ニーズに応じて適宜SaaSなどのサービスを組み込み、コンポーザブル型で組み立てていく」というアプローチである。背景には、グループ会社の多様なニーズ対応への考慮がある。また、データ統合については、「事業や企業を横断するデータレイクアーキテクチャーの事例は聞いたことがない」(塚本氏)ことから、物理的ではなく、データファブリック的かつ論理的なかたちで進めている。
データ戦略で不可避なテーマがAIだ。AI技術が目覚ましく進化していることを踏まえると、競争優位性の源泉はどのLLMを使うか、どうプロンプトエンジニアリングをするかではなく、「AIレディなデータの整備」だと同氏は強調する。
一般的なAI活用の目的として、業務の支援や代行があるが、「LLMは汎用的な知識には強いが、企業のナレッジや機密情報は知らない。企業のナレッジを適切にLLMが参照して使えるようにすることが必要になってくる」と説明した。
メタデータ整備でAI活用を加速
AIレディなデータが競争力になるという考えから、塚本氏らは現在、メタデータの整備に注力している。
具体的な取り組みとして、データカタログの整備、セマンティクスの整備などを進めているという。データカタログの整備では、データカタログシステムを導入し、従来ドキュメントシステムに書いていたデータの仕様や分析のノウハウを、カタログに集約していく方針だ。セマンティクスの整備では、集計ロジックに関するメタデータを整備することで、自然言語とAIエージェントを使って分析ができるようにするという。これにより、さらなるデータ活用の加速を狙うそうだ。
将来的には、ナレッジベースの整備も構想している。AIが知識やノウハウを参照するデータベースで、これまでのデータ分析に限定されない業務の支援を可能にしていきたいという。
「そのために必要な基盤技術を将来的に構築していきたいと考えています」(塚本氏)
最後に同氏は、IPのLTV最大化を目指すために「ポートフォリオマネジメントができる環境の整備を構築したい」と話した。
現在のメディアミックス収支ダッシュボードは、どのIPに対してどれだけ投資すべきかといったところは分からない状況だ。そのため、アニメ化するにはどういう作品が良いか、コミカライズするにはどういう作品が良いかなどをスコアリングする指標の構築を進めていきたい考えだ。
この指標が完成すれば、編集やメデイアミックスの担当者が自然言語で、「アニメ化で効果がありそうなIPの上位10を教えて」などと問い合わせることができるようになり、息の長いコンテンツづくりにつながる。
「今後、労働人口が減少するなかで生産性を維持するためにはAI活用が必要になります。消費人口も減っていくことを踏まえると、グローバル展開やライツビジネスなど、IPのLTV最大化を通じて息の長いコンテンツをつくり上げていくことも不可欠です。クリエイター、消費者、我々エンタメ業界の”三方良し”の関係構築のプラットフォームをつくっていきたいと思います」(塚本氏)
ファンが翻訳する「みんなで翻訳」
ゲオホールディングス傘下のviviONは、マンガやゲームといった総合二次元コンテンツサービスを手掛ける企業だ。viviONのグループ会社が運営する「DLsite」は、デジタルコンテンツのダウンロード販売サイトとして1996年にサービスイン、Amazonや楽天よりも早くにECを開始した。グループ全体で現在約1600万人のユーザーを抱え、同人作品からKADOKAWA作品まで幅広いデジタルコンテンツを販売している。
2021年に開始した「みんなで翻訳」は、ファンが購入した作品を翻訳して販売できるサービスだ。当初はAI翻訳を考えたが、AIの進化や“自分たちらしさ”を考慮し、「最速で一石二鳥を目指すことになった」と谷島氏は説明。そのために考えられたのが、一次創作者であるクリエイターと翻訳者の両方が報酬を得られる仕組みだ。クリエイターが翻訳者への報酬配分を決められるため、80%といった高い報酬設定も見られるという。ファンによる翻訳は「ファンがちゃんと中身を理解しているので、AI翻訳よりも内容が伝わりやすい」と同氏は話す。
システム側では、クリエイターから翻訳許可をとる仕組み、マンガ翻訳クラウドのMantra Engineとの連携に関わる開発などの作業を行った。
このサービスは予想を上回る成果を生んだ。開始から4年未満で累計売上20億円を達成し、翻訳許諾作品数も急激に増加している。意外な効果の1つが海賊版作成や流通への抑止効果だ。熱量が高い翻訳者の一部は、それまで自分たちの言語がないために海賊版をつくっていた人たちだった。この人たちが翻訳者として活動するようになり、海賊版の流通が減少したそうだ。
LLM活用により翻訳API比99.7%のコスト削減に成功
このように「みんなで翻訳」は成功を収めているが、この成長に伴い多言語データの分析基盤構築が急務となった。
早川氏はビジネス上の背景として、分析やレポーティングのために多言語翻訳による言語統一が不可欠だったこと、意見や要望などのデータが月次で150万文字ペースで増加していたこと、コストを挙げた。とくにコストについては、当初Google Cloud Translation APIを試したが、「1億文字を入力したところ、1日で100万円以上のコストが発生した」と苦笑まじりに明かした。
そのような経験を経て構築したのが、言語判別、翻訳エンジン、活用までを支えるLLMベースのシステムだ。早川氏によると、LLM利用のポイントは3つあったという。
1つ目はモデル選定だ。コスト効率と精度のバランスを重視してモデルを検証した結果、「Gemini 2.0 Flash Lite」を採用。
2つ目はプロンプトエンジニアリングである。出力の均一化が重要なことから、役割を明確に定義したり、条件分岐を明示したり、出力形式の厳密な指定をするなどの工夫を凝らしているという。
3つ目はシステム構築だ。viviONでは、データソース、データレイク、加工処理、データ利活用というパイプラインの真ん中に、言語判定と翻訳を組み込むというシステムを構築した。具体的には、BigQueryが備えるモデルをデプロイする機能を活用し、Dataflowで既存のパイプラインと合わせて管理するというやり方だ。データについては増分処理を採用し、翻訳前の言語判定により翻訳が不要なものは除外することで出力トークンを削減した。また、BigQueryのVertex AIの機能を使うことで効率的な一括処理を実現している。
構築したシステムでは、Cloud Translation APIを使用した場合に100万円以上かかっていたものが、0.3万円にコストダウン。
「99.7%のコスト削減率を実現しました。今後は、データからの分析などについても自動化していきたいと考えています」(早川氏)
谷島氏は最後に、AIの一般化がコンテンツ制作に与える影響に言及した。デジタル時代の今、コンテンツは増加傾向にある。とくに2022年12月のAI生成ブーム以降、AI生成作品の販売数が増え、同社ではAI生成作品の影響を鑑みて販売を一時停止する判断をした。その後、審査などのルールを整備したうえで、その基準を突破した作品のみを販売再開した経緯がある。
同社のパーパスは「ユーザーとクリエイターが楽しみながら、幸せに生きていける社会にする」だ。谷島氏は「コンテンツが増えることは、それだけ人の幸せが増える」との考えを示したうえで、「テクノロジーを活用しながらコンテンツの増加に対応していく」と述べた。



