KDDIグループのSupership株式会社が提供する広告プラットフォームの強みは、正確なキャリアデータに基づく広告配信の最適化にある。
その一方で、より厳密な取り扱いが求められるようになった個人情報のガバナンス強化とデータ利用の利便性の両立は、同社にとって大きな課題であり続けてきた。
Snowflakeのデータプラットフォームは、ビジネス側のデータ利用の適切な制御を実現すると共に、Hadoopクラスタのデータセンター運用において直面したハード調達や、管理における課題解決にも貢献している。
課題:1st Party Data利用に求められたデータガバナンスの確立
■事例先企業情報
企業:Supership株式会社
所在地:東京都港区虎ノ門一丁目17番1号 虎ノ門ヒルズ ビジネスタワー27階
■ご利用のSnowflakeワークロード
・データウェアハウス
■ストーリーハイライト
・Hadoopクラスタデータセンター運用の課題を解決
・データガバナンスの強化
・長期間のデータアクセスログ保存
KDDIグループの一員であるSupership株式会社は、正確なキャリアデータや先進的なテクノロジーに基づき、企業のDXをサポートするデータテクノロジー企業。企業のデジタルマーケティングを支援する「マーケティングテクノロジー事業」、企業が所有するデータと顧客接点の価値最大化を支援する「データイネーブラー事業」を二つの柱に事業を展開する同社の主要プロダクトが、デジタル広告の最適化を実現する各種プラットフォームである。 広告主向けプラットフォーム(DSP)「ScaleOut」、媒体社向けプラットフォーム(SSP)「Ad Generation」、社内外のデータを統合し分析するデータマネジネントプラットフォーム(DMP)「Fortuna」に代表されるプロダクトにおいて大きな強みになっているのが、KDDIグループがエンドユーザーとの合意に基づき蓄積する1st Party Dataの存在である。また、英国Novatiq社との共同開発による、プライバシーを確保し、ライフスタイルに応じた広告配信を可能にする独自の広告配信ID「Hyper ID」は、3rd Party Cookieの規制が進む中、大きな注目を集めている。
こうした中、新たな課題として浮上したのが、データガバナンスを巡る問題だった。提供者との直接契約に基づくデータ利用は、契約の範囲内で行うことが求められるが、データ量や活用機会の拡大、個人情報保護に関する法改正に、システムによる対応が追いついておらず、オペレーションによって対応していたのが実情だったという。法的な視点から社内のデータ運用をチェックする役割を担う、データエクスペリエンス推進部 部長の竹林 照光氏はこう説明する。
「当社の場合、広告配信プロダクトの開発・運用が先行し、そこにキャリアデータ活用というビジネスの枠組みが追加されたという経緯もあり、新たな施策や法律の変更があるたび、対応する状況が続いていました。その結果、データガバナンスはオペレーションによる対応の比重が高まり、それが利用者側の負担につながっていました。この状態は人為的ミスを誘発する可能性もあるため、その改善が急務となっていました」(竹林氏)
解決策:厳密かつ柔軟なアクセス制御がシンプルに実現できるSnowflakeを採用
増え続けるデータ量への対応も大きな課題だった。同社の広告配信プラットフォームの取り扱いデータは、8ペタバイトに及ぶ。100台規模のクラスタシステムによる自社データセンターを運用する中、その限界も見えてきたという。プロダクト開発本部 アドテクノロジーセンターの今村 豊氏はこう説明する。
「まず挙げられるのがサーバ負荷に対応した、調達・運用コストの問題です。サーバ修理や拡張、メンテナンスに関する人的コストに加え、近年は半導体不足でハードが計画通りに調達できないという問題も生じ、先を見越したキャパシティプランニングが困難になりました。こうした状況を受け、クラウドへの移行を本格的に検討することになりました」(今村氏)
ストレージ容量の制約から、データ活用が可能な期間のデータアクセスログの保存が困難な状況になっていたことも、課題の一つだったという。クラウドプラットフォーム選定は、コストとデータガバナンスの二点を軸に評価が行われた。
「データガバナンスの観点では、アクセス制御がいかにシンプルなアーキテクチャで行えるかという点に注目して評価を行いました。施策の変化や法改正にシステムで対応するには、その都度、膨大なエンジニアリソースの投入が必要となります。その繰り返しの中で我々が学んだのは、個人情報を伴うデータ基盤の運用には、厳密かつ柔軟なアクセス制御の仕組みが不可欠ということでした。Snowflakeの場合、アクセス制御設計の青写真 が『このように設計すれば分かりやすく管理できます』という形で、公式ドキュメントとして公開されていました。それもあり、迷うことなく素早く実装できそうだという感触は、早い段階から得ることができました」(今村氏)
もう一方のコストの観点でもSnowflakeの評価は高かった。
「クラウドデータ基盤は、単純にコンピュート利用量に応じて課金されることが一般的で、利用者の観点ではどれだけ使ったのかが見えにくく、請求書が届いて驚くということが珍しくありません。一方、仮想ウェアハウスのサイズを選択し、その利用時間に応じてコストが発生するSnowflakeの場合、利用者はコストを体感的に把握することが可能です。体感的なフィードバックはクエリ発行の改善につながるため、コスト管理の観点でもメリットは大きいと判断しました」(今村氏)
さらにグループ会社であるDATUM STUDIOにはSnowflakeの認定資格保有者が多数在籍し、国内屈指の実績を誇る有力なパートナーであったことも、選定理由の一つだったという。
結果:データ基盤の管理コストを削減しよりスマートなアクセス制御を実現
Snowflakeのデータ基盤には、広告配信プロダクトだけに留まらない多様なデータ利用を前提とした約1ペタバイトのデータサブセットを移行。そのデータは現在、約10名の専任のデータアナリストチームと、約20名のビジネス側スタッフによる多様な分析に活用されている。
データ基盤の運用という観点からは、Snowflake利用のメリットは大きく三つあげられる。一つはコンピューティングクラスタの管理が、管理者側から利用者側に移譲された点である。
「ニーズに応じたリソース確保は管理者にとって常に大きな課題で、すでにお話しした通り、半導体不足によるハード調達の困難さは、中長期的なキャパシティプランニングの難しさにつながっていました。一方、ユーザー自身が仮想ウェアハウスのサイズを自由に選択できるSnowflakeは、管理者によるこうした手間を完全に省きます。コストとして見えにくい部分かもしれませんが、1、2年後を見据えて取り組んできたシステム管理部門の労力が不要になることは、大きなメリットであることは間違いありません」(今村氏)
次が大きな課題だったアクセス制御の実現である。
「厳密かつ柔軟なアクセス制御の実現により、少ない工数で変化にスムーズに対応することが可能になりました。さらにプラットフォームが提供するデータビューを利用することで、ユースケースに応じたデータマスキングが自動的に行われるようになったため、以前のようにデータ利用者側が利用ルールをきめ細かく整備する必要がなくなったことは大きなメリットの一つです」(今村氏)
最後がデータアクセスログの長期保存の実現である。
「標準で提供されるデータアクセスログ用ビュアーだけでも必要な機能が満たせる上、ストレージを別途確保することで、より長期間のログ保存も可能になりました。中長期の利用状況が見えるようになったことは、データガバナンスの観点に加え、データ運用の課題抽出にも役立っています。例えば、個人情報保護法改正に対応して特定データの仕様を変更する際、当該データをどのユーザーがどんな目的で利用しているかが一目で分かるようになったことは、業務の効率化を図るうえで大きな役割を果たしています」(今村氏)
さらにキャパシティが限界に達していたデータセンター内のHadoopクラスタと比べ、データ生成時間が以前の10分の1程度に短縮できたことも成果の一つである。
1/10:処理速度を大幅に短縮
将来:データガバナンス強化とデータ利用の利便性の両立を追求
3rd Party Cookie規制により、1st Party Dataの重要性が再注目される中、多くの企業が直面するのが個人情報保護とデータ利用の利便性の両立であることは間違いない。Snowflakeによる厳密かつ柔軟なデータアクセス制御の実現は、この課題を解決する上で大きな一歩となった。
「データガバナンス担当者の観点としては、近年の個人情報保護の強化がデータの使いづらさにつながることは避けたいと考えています。こうした中、Snowflakeによってビジネス側が安全にデータ利用を行うためのガードレールが敷設できたことは、大きな一歩であると考えています。もちろん現時点ではガードレールは完全なものではありません。『ここにあるデータは、どれも安全に使えます』と明言できるところまで、整備を進めていきたいと考えています」(竹林氏)
また、プラットフォームコストの一層の削減も、これからの課題の一つだ。
「データアクセスログによるデータ利用状況の可視化は、プラットフォームの見直しにも大きな役割を果たすと考えています。今後は利用状況の分析を通し、データ基盤運用の最適化という課題にも、積極的に取り組みたいと考えています」(今村氏)
Snowflakeについて
Snowflakeは、Snowflakeのデータクラウドを用い、あらゆる組織が自らのデータを活用できるようにします。お客様には、データクラウドを利用してサイロ化されたデータを統合し、データを発見してセキュアに共有し、多様な分析ワークロードを実行していただけます。データやユーザーがどこに存在するかに関係なく、Snowflakeは複数のクラウドと地域にまたがり単一のデータ体験を提供します。多くの業界から何千ものお客様(2021年7月31日時点で、2021年Fortune 500社のうちの212社を含む)が、Snowflakeデータクラウドを自社のビジネスの向上のために活用しています。詳しくはsnowflake.comをご覧ください。
関連リンク
※本記事はSnowflakeから提供を受けております。
[PR]提供:Snowflake