今や、データ活用の取り組みは業種・業界や組織の規模を問わない共通の課題となっている。全日本空輸(ANA)も例外ではない。安全の確保、顧客体験(CX)の改善、業務効率化、収益への貢献などを目標に、データを活用すべく基盤を整えている。
その中核となるのは、「BlueLake」と称するデータ活用プラットフォームだ。BlueLakeを構成するデータウェアハウスとしてSnowflakeを採用、「Amazon S3」とつないでいる。
全日本空輸 デジタル変革室 イノベーション推進部 データデザインチーム リーダーの井岡大氏、デジタル変革室イノベーション推進部 データデザインチーム松浦 洋太郎氏に話を聞いた。
Snowflake採用の理由は「データ基盤のコンセプトに合う」
ANAがデータ基盤を構築するきっかけの一つが、データの民主化だ。ANAは航空会社だが、「ANA Mall」として展開するECなど、“NonAir”と呼ぶ航空以外の領域にも事業を拡大している。本業の“Air”、“NonAir”のいずれにおいてもデータ活用のニーズが高まっている。
そこで構築したのがBlueLakeだ。データをオブジェクトストレージの「Amazon S3」に格納し、データウェアハウスとして以前から利用していた「Amazon RedShift」、そして1年前に「Snowflake」が加わった。
Snowflake採用の理由はいくつかあった。最大のポイントは、「私たちのデータ基盤の考え方に合う点」と井岡氏は説明する。先述したように、S3を中心に据えることから、「S3との親和性が高く、柔軟性があるSnowflakeがフィットすると判断した」と松浦氏は語る。
「この業界は動きが速い。優れた技術がどんどん出てくるし、それを“つまみ食い”できるのがクラウドの良さ。今後どのような技術が登場するのかわからないからこそ、柔軟性を重視している」と、井岡氏はいう。
BIツールとの接続性、運用保守の効率化、拡張性、性能も評価
細かな評価ポイントとして、松浦氏が最初に挙げたのがBIツールとの接続性だ。ANAはTableau、QuickSightなどのBI製品を導入しており、Snowflakeはこれらと接続するための開発工数が他の製品と比較すると大幅に短縮される点が評価された。これは、将来、他のBI製品を使ってみたいとなった時にも柔軟に対応できることも意味する。
このほか、運用保守の効率化、拡張性、性能なども評価した。例えば運用保守では、「Snowflakeはフルマネージドサービスなのでタスクを大幅に削減できる」と松浦氏。他社のフルマネージドサービスと比較したうえで、Snowflakeが、同社利用する上で重視するポイントとフィットしたのだという。
このような評価に基づき、2023年春ごろにPoCを実施、議論を複数回重ねた。また、2023年にSnowflakeが米国で開催する年次イベント「Snowflake Summit」に参加して同社のコンセプトを理解し、他のユーザーの声も聞いた。上記のような経緯を経て、ANAはSnowflake導入を決断した。
用途や役割に合わせてダッシュボードを作成
S3、Snowflake、RedShiftで構成される「BlueLake」では、プライバシーへの配慮として、個人情報が入っている領域、入っていない領域と完全に分離している。「個人情報が入っている領域があり、それを全部仮名化して個人情報のない領域を持っているというイメージ」と松浦氏は説明する。Snowflakeは個人情報が仮名化された領域で利用している。ここから、BI、可視化などのツールと接続し、機械学習に利用する。
-
ANAのデータ活用基盤「BlueLake」の構造。プライバシーに配慮した2層構造となっている
実際に使ってみて、当初狙っていた効果を実感しているという。
導入効果として、松浦氏はまずコストを挙げた。「競合製品と比較すると、かなりコストを抑えられている。ユーザー数の増加、つまり実利用に即したコストの上がり方をするので透明性が高い」(同氏)
データ民主化のために、ANAは用途や役割に合わせて、BlueLakeブランドで視覚化のダッシュボード「BlueLake Repo」、BIダッシュボードの「BlueLake Pivo」などのツールを用意している。
例えば、BlueLake Repoはグループ全社員が閲覧できるダッシュボードで、Snowflakeをデータソースに、DX組織が全員に見てほしいデータやリクエストがあったデータをダッシュボード化している。具体的には、フライト運行の定時性、日次の搭乗実績、手荷物数などが含まれており、空港別のフィルタなどの機能もあるという。
これまでは、各空港がExcelでデータを抽出してグラフを作っていたようなデータを、共通の指標で並べることが可能になった。「Snowflakeにより、欲しい情報をスピーディーに視覚化できる」(松浦氏)
井岡氏はBlueLake Pivoについて、「マーケティングなどでは、このようなセルフBIを一部実現していた。しかし、オペレーション部門に関しては、費用対効果の観点から予算がなかなか取れなかった。BlueLakeとして基盤を整えたことで、オペレーション部門でもどんどん自動化が進みつつある」と話した。
Iceberg Tablesなど、Snowflakeの新たな機能に期待
少しずつ動き始めたANAのBlueLake、すでにユーザー数は1400人を超えるという。今後はどのように進化させていくのだろうか。
松浦氏はまず、「Snowflakeの機能を使いこなしたい」と話す。中でも、SnowflakeでApache Icebergのテーブルを利用できる「Iceberg Tables」は「すぐにでもチャレンジしたい」という(Snowflakeは先にIceberg TablesをGAとし、Iceberg用のオープンソースカタログ「Polaris Catalog」も発表している)。また、 従来環境の整理を含めた効率化も挙げた。
この他、SnowflakeのAIである「Snowflake Cortex」や「Streamlit」なども気になっているそうだ。Stremlitでは、既存のBIツールでは難しかったきめ細かな分析や可視化を実現できるのでは、と期待を寄せる。データ共有の「Data Sharing」や外部のデータを利用できる「Marketplace」にも興味があるという。
ANAはこうした機能を使いながら、データの活用の用途を広げ、深めていく構えだ。
「Snowflakeの持つBIツール、ETL製品との親和性、データカタログやデータストアとの親和性などに大きな将来性を感じている。これらの特徴を生かしながらCXの改善、業務効率化、安全性の強化、そして収益に貢献できるようなデータの活用を進めていきたい」と井岡氏は語っていた。