Clouderaは4月21日、1年半ぶりとなる戦略説明会を実施した。同会見では、米国本社CRO(最高収益責任者)であるフランク・オデュード氏と日本法人社長である大澤毅氏から、グローバルおよび日本におけるビッグデータ管理の実態、ならびにClouderaの企業戦略について説明が行われた。
会見では、同日にビッグデータの活用を牽引する企業を支援するプログラム「Innovation Program」の第1号ユーザーへの選出が発表されたLINEから、執行役員Chief Data Officer of Global Officesであるフィゲン・ウルゲン氏が登壇した。
3年後までに日本で3つの「きょうそう」を実現
Clouderaは、オープンかつオンプレミス/クラウドの混在環境に一貫したデータ基盤を提供するハイブリッドデータプラットフォームのソフトウェアベンダー。
「現在、経済の情勢は非常に不透明です。そして、その状況がビジネスリーダーたちの意思決定にも大きな影響を及ぼしています。またコロナ禍の対応策として、レジリエンス(回復力)とアジリティに対応できるかに焦点が当てられていましたが、現在はいかに効率性を追求できるかが最大の焦点になっていると思います。昨年末の調査では、企業が2023年にはデータおよびアナリティクスへの投資を増やす予定であることが明らかになりました。この結果は、企業がデータを活用することで、多くの知見が得られるということを表しています」(オデュード氏)
このような背景から、Clouderaはビッグデータの活用を全社展開している大手企業を中心に多くの企業に採用され、グローバルで4000社以上の顧客企業を抱えている。自動車事業、金融事業、医療事業、保険事業、小売事業、テレコム事業など、各業界のトップ10企業のほとんどを顧客としているという。
「企業への採用率もさることながら、もう一つClouderaを語る上で面白いデータがあるので紹介します。今現在、全世界のデータ量は80ゼタバイトあると言われていますが、弊社はその内の1.25%を管理しています。そしてこれが年率23%で成長している、というところがデータから見た弊社の大きな特徴となっています」(大澤氏)
このように全世界で支持されるClouderaだが、日本では3年後までに「日本企業のBig Data活用を促進し、変革の波を起こす」という目標を掲げているという。
またこの目標に基づき、各業界のビッグデータ活用を牽引する「キャプテン」を10社確立するために、顧客企業によるデータ分析基盤などの製品導入を支援する新たなプログラムを開始することが発表された。
支援プログラムの名称は「Innovation Program」で、顧客が先進的な取り組みを実践しようとしていることを支援の条件に選定される。業界ごとに1社を目途に選ばれ、第1号のユーザーとして今回ゲストスピーカーとして登壇しているLINEが選定された。
「Innovation Program」の目標は「共走」「強壮」「共創」という3つの「きょうそう」に分かれており、共走では「各業界のBig Data活用を牽引するトップランナー達を集め、日本のデータ活用を牽引」、強壮では「Clouderaコミュニティ(ユーザー会)を活性化し、ノウハウの共有やハンズオンを実施」、共創では「データ共同利用・ユースケースの検証&共同事業化の実現支援」を行っていくという。
そして、このような取り組みを行っていくことで、Clouderaは、ビッグデータがもっと身近で当たり前になる世界の実現を目指す方針だ。
LINEが進める「データ利活用の民主化」
では、そんなClouderaを採用している先進的な事例を紹介しよう。それが、今回の会見にも登壇したLINEだ。
LINEは、CDP(Cloudera Data Platform)が適用された3500 nodes 超規模のデータ基盤で290PBのデータ量・日々のワークロード15万超を活用しており、さらに重要なデータに対してApache Icebergを適用することよって、「効率の良い、真のデータ活用の民主化」を実現しているという。
「LINEでは多くのサービスを提供しています。その一つのLINEメッセージも多くのユーザーに利用されていて、データの量が膨大になってきています。私たちは独自にInformation Universe(IU)というオンプレミスの環境を構築しています。このIUはデータサイエンティストあるいは機械学習の担当者だけでなく、ディベロッパーがログを監視するといったセキュリティにも活用されています」(ウルゲン氏)
ウルゲン氏は、IUを構築している背景には「データ利活用の民主化(Data Democratization)」という考えがあると説明した。
「データ利活用の民主化とは、ビジネスニーズを持つすべての人がデータを利用できるようになることを表しています。このガバナンスに留意しながらデータの活用を進めていきたいと考えています。特にプライバシーデータや機密データの保護を重視しており、最新の注意を払っています。そのため、データを迅速かつ容易に検索し、アクセスできるよう、取り組んでいます」(ウルゲン氏)
だが、LINEのサービスが拡大しても喜んでばかりはいられない、とウルゲン氏は語る。
ユーザーの増加はビジネスの面では喜ばしい一方で、社内ユーザーも増え、データプラットフォームの規模も急拡大する必要が生じてそいまい、データプラットフォームのエンジニアなどにとっては大きな問題だった。
2020年と2023年のIUの規模を比較すると、ノード数は2倍の3500ノード、データ容量は3倍の290PB、毎日のジョブ数は2.5倍の15万超に達しているという。
「このようにデータプラットフォームの規模が急拡大し、開発運用の業務が増加しても、それを支えるだけのデータエンジニアの採用は難しいというのが現状です。そのため、以前はオープンソースベースでデータプラットフォームを自社で開発・運用をしていましたが、2020年からはClouderaとパートナーシップを組み、段階的にCDPへの移行を進めました」(ウルゲン氏)
LINEで得られたCDPの利点としては、迅速な対応と改善を行う「安定稼働」、チームの一員として業務を分担してくれる「運用コスト削減」、先端技術の導入を進めている「研究開発」という3点が挙げられた。
ウルゲン氏は、会見を以下のように締めくくった。
「今後の展望として、データ活用のさらなるガバナンス向上につながる改善を継続していくことを考えています。またそれに加えて、データの民主化を加速させるための先進的な技術も積極的に取り入れていく方針です。Clouderaとの協業については『Innovation Program』の認定によって、さらなる運用コスト削減や新技術導入のスピードアップに寄与することを期待しております」(ウルゲン氏)