人の目ではとても追いきれない莫大な量のデータから、どうすれば意義のある情報を短時間で取り出すことができるのでしょうか? 多くのデータ・サイエンティストがこの課題に対して頭を悩ませています。ビジネスに落とし込むならば、情報分析の効率化は欠かすことができません。

7,000 万人を越える T 会員の購買履歴データを分析・活用している CCCマーケティング株式会社は、そうしたビッグデータの高速処理にもっとも長けた国内企業の一つです。同社は Azure Batch を基盤に、ライフスタイルを推論する AI のオートメーション・プラットフォームを開発しました。ビッグデータを分析する AI の作成を自動化・高速化したことによって、具体性に満ちたプロモーション施策を次々に提案することが可能になったのです。

膨大な顧客データを読み解くための AI を、誰でも作れるように

CCCマーケティングは、最新のテクノロジーを活用したマーケティング・ソリューション事業を展開しています。カルチュア・コンビニエンス・クラブ( CCC )グループの一員である同社は、7,000 万人を超える会員が日々利用する「 Tカード」の情報を分析し、マーケティング戦略を提案しているのです。

プラスチック製のカード、あるいはスマホアプリの「 Tカード」は、コンビニやスーパー、ドラッグストアでの買い物から、レストランやファッション、旅行、美容、電気・ガス、さらには配信サービスや宅配サービスまで、日常のあらゆるシーンをお得にしています。

CCCマーケティングは、 Tカードの利用履歴のうち、個人を特定できる情報を除いた購買履歴データを読み解くことに力を注いできました。同社では、購買履歴や行動履歴などから個々の T 会員の生活属性を推計した「顧客DNA」というデータベースを構築していると、CCCマーケティング株式会社 データベースマーケティング研究所 所長 毛谷村 剛太郎 氏は言います。

「『顧客 DNA 』は、T 会員 1 人 1 人の T カードの購買履歴や行動履歴から『未既婚』『子供の有無』『年収レベル』『』居住形態』等々の生活属性や志向性を約300項目に渡って推計したデータベースです。独自データベースである『顧客DNA』は隔月で自動更新される仕組みになっており、新たな購買履歴の傾向によりその人の既婚率が 10 %から 80 %になる、といった変化が常に生じています」(毛谷村 氏)。

  • CCCマーケティング株式会社
    データベースマーケティング研究所
    所長 毛谷村 剛太郎 氏

マーケティング施策を講じるにあたって『自社製品を買っているのはどんな人なのか』といった消費者像を知ることは極めて重要です。既存客と似た傾向の相手に対してプロモーションを展開すれば、それだけ効果を期待できるからです。CCCマーケティングはそのために、7,000 万人の T 会員から日々収集される膨大な商品購買履歴から構築される顧客DNAというデータベースを駆使してきました。

ところが、この膨大なデータベースを利用するにあたって、悩ましい課題があったと毛谷村 氏は言います。

「オンプレミスでの保守運用が大変だった、という事はもちろんなのですが、私たち研究所サイドでは、マーケターからの要望に応えきれないという事態が起きていました。たとえば、食に関しての嗜好予測に『高級志向』という項目があったのですが、それだけでは、和食が好きなのか、洋食が好きなのか分かりません。本当は『高級イタリアンを好む人はどんな生活スタイルなのか』といった細かい情報まで必要だったのですが、個々の案件に対応することが困難だったのです」(毛谷村 氏)。

こうした状況の中、2016年、毛谷村 氏にあるひとつのアイデアが浮かびます。

「手動で対応が難しいのなら『高級イタリアンが好き』といったDNA項目を、自動で誰でもかんたんに追加できる仕組みをつくればいいのでは、と思いついたのです」(毛谷村 氏)。

専門的な知識を必要とせずに、膨大なデータベースから生活属性の推測ができる AI をオートで製作するという、前代未聞の AI プラットフォーム「 DNA Predictor 」の開発がここに始まりました。

Low-priority VMs の活用によって、大規模処理のコストを 8 割減

DNA Predictor のシステム基盤には、Microsoft Azure が採用されています。その経緯について、CCCマーケティング株式会社 データベースマーケティング研究所 技術開発 ユニットリーダー 三浦 諒一 氏は次のように説明します。

「当時はちょうど、購買履歴のデータプラットフォームをオンプレミスから Azure へ移行することが決まった段階でした。大量のデータをやり取りするにあたって、別のクラウドを使うと通信がボトルネックになってしまいますから、DNA Predictor を Azure 上に構築することはすんなりと決まったのです」(三浦 氏)。

  • CCCマーケティング株式会社
    データベースマーケティング研究所 技術開発 ユニットリーダー
    三浦 諒一 氏

クラウド上に新たなシステムを構築することに関しては、マイクロソフトからの技術支援が大いに助けになったと三浦 氏は続けます。

「私たちはクラウド上での開発経験が無かったので、アーキテクチャ設計から細かいチューニングまで、全面的なサポートが非常に助かりました。特に、クラウド アナリティクスや AI を専門とする"黒帯( Global Black Belt )"の技術者チームに入って頂けたことは大きいです。何しろ大量のデータを扱うので、普通に処理すると、もの凄く時間がかかってしまいます。しかし、" Azure Batch "をご紹介頂き、高性能の仮想マシン( VM ) 10 台を起動して 400 個のタスクを並列処理するという手法に辿り着いたことで、1 日がかりの処理が 30 分で完了するようになりました」(三浦 氏)。

Azure Batch とは、大規模な並列コンピューティングやハイパフォーマンス コンピューティング ( HPC )のジョブを実行するためのクラウド サービスです。CCCマーケティングでは、Azure のコンピューティングが余剰になっている時間帯に処理をする" Low-priority VMs "を用いることによって、驚くほど低コストで Azure Batch を利用しています。

「ハイスペックな VM を複数稼働させるアーキテクチャではコストがかさんでしまいます。しかし、このシステムの利用は社員が対象ですので、もし処理が中断してしまったとしても、リトライが許容されるものでした。ですから、Low-priority VMs のデメリットはさほど感じずに導入することができたのです。これにより、8 割ものコストを削減しています」(三浦 氏)。

運用を担当するCCCマーケティング株式会社 データベースマーケティング研究所 技術開発ユニット シニアMLエンジニア 岸部 友裕 氏は、Low-priority VMs による影響はほとんど感じないと言います。

  • CCCマーケティング株式会社
    データベースマーケティング研究所 技術開発ユニット
    シニアMLエンジニア 岸部 友裕 氏

「処理を何段階かに分けたり、リトライを自動化したりなどの対処によって、ほとんどデメリット無く運用ができています。実際、途中で処理が割り込まれて中断してしまった、ということは想定したほどにはありません。ユーザーは、AI モデルの作成を開始したら、あとは Teams に通知がくるまで、他の業務に専念できています」(岸部 氏)。

  • DNA Predictorのシステム構成図

DNA Predictor による顧客理解でプロモーション施策が深化

Azure Batch を基盤にした DNA Predictor は、2018年6月から、CCCマーケティング社内にローンチされました。この AI プラットフォームの操作は非常に簡単だと、岸部 氏は説明します。

「たとえば『 2、3 歳のお子さんがいる人』の傾向が知りたいとします。その場合、まずは一部の会員に対してアンケートを取り『いる人』と『いない人』のリストを作成します。あとは、そのリストをドラッグ&ドロップで放り込むだけで、自動的に AI が全会員の中から『 2、3 歳のお子さんがいる』確率の高いデータを抽出してくれるのです」(岸部 氏)。

通常、応用水準にある AI モデルの作成には「教師データの作成」「モデルの生成と評価」「再学習」といった反復的なプロセスが必要です。手動でやる場合は、7,000 万人のデータから教師データに適したものを抽出するだけでもひと苦労でしょう。CCCマーケティングは、どうやってここまでの自動化を可能にしたのでしょうか。その秘密の一端を、毛谷村 氏は次のように明かします。

「私たちは、T カードのデータをいかに機械学習に適用するかといった研究を続けてきました。その推論のためのアルゴリズムを、DNA Predictor にも搭載しているのです。多種多様な業態の購買履歴を一元的に扱うためのデータの前処理技術の独自ノウハウや、あらゆる予測問題に対応するための AI モデルの実装、さらには蓄積されていく新たな DNA 項目自体を次の予測問題を解くための特徴量化するエコシステムの実装などが、工夫の一例です」(毛谷村 氏)。

2020年現在、日本において、独自 AI の作成をここまで自動化できている企業は他に無いでしょう。唯一無二な AI プラットフォームである DNA Predictor を活用することによって、従来よりもはるかに優れたターゲティングが可能になっていると、毛谷村 氏は言います。

「従来のツールと比べても、DNA Predictor によるターゲティングは非常に大きな成果が出せています。効果的なマーケティング施策によってクライアントのコスト削減・売上げ増に貢献した結果、これまでに社内でも何人ものメンバーが表彰されてきました。当初はこうしたプラットフォームを独自開発することに懐疑的な意見もあったのですが、現在は社内で年間 600 件以上利用されており、十二分に価値を発揮できていると考えています」(毛谷村 氏)。

また、DNA Predictor は、社内のマーケティングに対する考え方そのものを深化させていると毛谷村 氏は続けます。

「どんな商品でも開発の際にターゲットが設定されていますが、この層にプロモーションすれば売れるかというと、必ずしもそうとは限りません。20 代 OL 向けに作ったけれど、買っているのは40代の主婦、といったこともあるわけです。提示されるターゲットを鵜呑みにせずに『高確率で買ってくれそうな人は誰なのか』という本質的な問いを突き詰めて、真に効果のある施策を提案する。DNA Predictor によって、そうした顧客理解への考え方が根付き始めているように感じます」(毛谷村 氏)。

マーケティング・オートメーションの世界へ

DNA Predictor は今後、API を外部に公開することが検討されており、そのための改修を2020 年春に担当したと、岸部 氏は語ります。

「API 連携を想定して処理の最適化をおこなったのですが、開発した 3 年前と比べて Azure Batch が Docker フレンドリーになったことを感じます。他にも、VM1 台につき何個のジョブを並列で動かすのかといった設定も簡単にできるようになり、非常に使いやすくなりました。引き続き、Azure の機能を活かしながらセキュアに限定公開できるよう取り組んでいきたいと思います」(岸部 氏)。

毛谷村 氏は「究極の顧客理解」に向けて次のように構想していると言います。

「 DNA Predictor を通じて問いかければ問いかけるほど、『顧客DNA』のデータベースは充実していきます。『高級イタリアンが好き』といった、これまで無かったライフスタイル属性や、特定商品に対する購買ポテンシャルなどの特徴量がどんどん増えていくからです。今後は、このようにデータベースそのものを進化させるとともに、『暑い』『外出中』といった、動的な状況も察知することによって、T 会員 1 人 1 人の『今』に寄り添ったマーケティングを実現したいと思っています」(毛谷村 氏)。

Azure Batch を基盤にすることで、7,000 万人の T 会員が日々行う巨大な消費のデータベースから、新たな顧客をスピーディーに推論する AI プラットフォームを開発したCCCマーケティング。同社は、次世代型店舗"スマートストア"の取り組みなどと連携していくことによって、本当に「気の利いた」マーケティング・オートメーションを可能にしていくことでしょう。

[PR]提供:日本マイクロソフト