九州旅客鉄道(JR九州)がデータクラウド「Snowflake」を導入して、顧客データを活用する環境の刷新を進めている。これまでバラバラに管理されていてデータを一元化することで、グループ会社を含めてデータの利活用を進めることを狙っているのだ。
今回、同社の総合企画本部IT推進部グループマーケティング室で主席を務める田中裕樹氏に話を聞いた。
データドリブンに向けた課題は「内製化」と「スピード」
JR九州は2022年~2024年の中期経営計画の下、グループ横断での顧客管理基盤の整備を進めている。中心となる組織が、それ以前に発足していたのがグループマーケティング室だ。鉄道、事業開発などそれぞれが会員組織を持って運営していたが、これを一元化することを目指して2017年に発足した組織だ。
それまで、システム開発や運用からDMP構築などを手掛けてきた田中氏は、グループマーケティング室で顧客データ利活用のための環境を構築することになった。手掛けるデータとしては、毎日発生しているICカードの利用実績や列車予約情報、キューポ(ポイント)に関する情報などがある。
このほか、線路にあるセンサーデータから故障予知をするなど、顧客とは関係のないデータなども活用を視野に入れており、グループ会社と協力しながらプロジェクトを進めているという。
「お客様を一人一人しっかり見るということからスタートしました。今後、DX(デジタルトランスフォーメーション)が進んでいく中で、全社にデータドリブンを根付かせていくことをトップダウンで進めています」と、田中氏は中期計画の意味合いを説明する。
加えて、同社は5年前に作成した分析環境に課題を抱えていた。自社で仕様を作成してシステム子会社に構築してもらったシステムだが、「改修等についてシステム子会社に依存しているため、スピード感を持って分析環境の拡大を推進できていなかった」と田中氏は振り返る。
「あるデータが必要となっても、見積もりから始めてやりとりをしているうちに1カ月が経過するという状態でした。データが増えてくると処理が終わらないこともあり、1日20時間以上もデータ加工処理が動いている状態です」(田中氏)
このように、JR九州では、データ活用においてスピード、それを実現する内製化が求められていた。
Snowflakeを選んだ理由は「データの増加をものともしない処理性能」
ちょうど、分析環境を支えるハードウェアの保守切れが近づいていたことから、顧客管理基盤のクラウドへの移行を検討した。当初はクレジットカード系のデータはクラウドに載せられないと判断してオンプレミスの環境に構築した。だが、現在はPCIDSS(Payment Card Industry Data Security Standard)によりカード番号を保持しない(非保持化)方針となったことで、クラウドへのデータ格納への課題はクリアされた。
「5年前に比べると、大手企業がクラウドを活用するという事例がどんどん出てきており、クラウドに対する不安やネガティブなイメージが払拭されていました」と、田中氏はいう。
そこで、やりたいことをRFI(情報提供依頼書)としてまとめ、複数のITベンダーに提案を募った。その中から、自社のニーズに対する解をもらえそうなベンダーにRFP(提案依頼書)を発行して提案をもらった。
当初、仮想基盤をAWS(Amazon Web Services)に移す計画があった。それも踏まえ、RFPには「クラウドプラットフォームはAWSにすること」「内製化に向けて開発を通じて技術力を転嫁してもらうこと」「(データを抽出→変換→書き出しの順に進む)ETLから、(抽出→書き出し→変換の順に進む)ELT化を推進すること」などを織り込んだという。
最終的に、SnowflakeとCDP(顧客データプラットフォーム)ツールが選択肢として残った。将来的に顧客系以外のデータも活用を計画しているため、ソリューションの選定にあたっては、データ量が増えた時に処理時間にどのような影響が出るのかが重要なポイントだったという。
Snowflakeは1つの処理に対して専用の処理機構を持つことから、処理間で影響は発生しない。データが増えても処理ごとにウェアハウスのスケールアップやスケールアウトを行うことでチューニングが容易に行える点が、Snowflake導入の決め手となった。
Marketplaceを使ったデータ共有も視野に
2022年4月にプロジェクトが立ち上がり、2021年年度末にSnowflakeの採用を決めた。現在、移行作業を進めており、日々発生するデータを現行環境から差分で移行しているところだ。
旧環境と並行して動かすことで、同じ処理をして同じ処理結果となることを検証しつつ、処理ごとにSnowflakeのウェアハウスのサイズのチューニングを行っているところだという。ハードウェアの保守が切れるのは2023年6月。それまでに旧環境は切り離す計画だ。
本稼働はしていないものの、田中氏はすでにSnowflakeのメリットを体感しているようだ。「旧環境でデータ抽出に1時間かかるところ、Snowflakeなら数分で終わります。時間の差に驚いています」と同氏は話す。
新しい環境では、ELTとして、データ加工もSnowflake側に移したことも高速な処理に寄与しているようだ。BI担当者などユーザーも速度には驚いているという。「本当の意味で、Snowflakeの恩恵を受けるのはこれから。とはいえ、スピードだけでもユーザーに好評です」(田中氏)
そして、Snowflakeがもたらすメリットはスピードだけではない。「旧環境は重たくて、処理を流すと本番の処理が落ちることもありました。今はその心配がなく、ストレスから解放されました」と田中氏。ハードウェアがなくなれば、ハードウェアにまつわるストレスからも解放される。
このように、JR九州ではデータ活用の環境が着々と整いつつあるが、約200万人のネット予約会員に対して、ICカードやクレジットカードのIDをまとめてもらう「おまとめ登録」を促し、一元化を進めていく。グループ会社には、JR九州本体がデータ活用の環境を用意していることを伝えているところで、希望があれば、グループ会社も6月以降にデータ活用の環境を利用できるようにするという。
さらに、今後はデータ共有も視野に入れている。例えば、九州新幹線の予約状況がわかれば、何時にどの駅にどのぐらいの人が行くのか、どのような人たちなのか、といった情報が事前にわかる。このデータが得られることで、その駅付近の小売、他の交通機関などは施策を打つことができる。自社のデータを販売できるMarketplaceである「Snowflake マーケットプレイス」におけるデータ提供も考えていきたいという。
最後に田中氏は、「九州を元気にするという思いをデータの面で支える、その環境が整い、地元の企業に活用いただける世界を実現させたいですね」と想いを語っていた。