2020年7月9日に開催されたWebセミナー、「マイナビニュースフォーラム 2020 Summer for データ活用」。アフターコロナを見越した、新たな時代に即したデータ活用の形を模索するさまざまな講演が行われた。本記事では、新時代に向けたデータプラットフォームの形を提唱するSnowflake Senior Account Executive池田大助氏によるセミナーの内容を紹介する。

  • Snowflake Senior Account Executive池田 大助氏

    Snowflake Senior Account Executive池田 大助氏

新しい時代に対応するために始まるデジタルトランスフォーメーション(DX)の本格推進

コロナ禍によって、ビジネススタイルは大きな変革を余儀なくされた。リモートワークが定着し、書類の決済や情報の共有方法も大きく変わった。そして、これまでのような人と人との関わり方も変わったことで、ビジネスにおける決断には以前より、データが重視される傾向が強くなった。

「新しい時代に対応していくためには、誰もがどこからでもデータにアクセスできて、そこから決断を導いていく、デジタルトランスフォーメーション(DX)の本格的な活用が必須となります」(池田氏)

なぜ、DXを推進すべきか。その理由はDXによって実現する圧倒的なビジネススピードにある。

「データを、高速に見える化し、高速に判断を下して、高速に行動する。そのための手段がDXなのです」(池田氏)

IoT、モバイル、ソーシャルと、データの急増や多様化が進むにつれて、より迅速なビジネスの意思決定が求められるようになる。そのためにも、DXの推進は欠かせない。

「全ての組織をデータドリブン」へと導くSnowflake

Snowflakeはクラウド向けに開発された高速かつ低価格なデータウェアハウス(DWH)である。

DWHのクエリを実行する「コンピュート」と、データを格納する「ストレージ」を分離するという独自のアーキテクチャを持つ。それぞれが独立しているため、複数のワークロードを競合なく、同時に処理することができるため、他のDWHには無い、高い同時実行性能を実現している。また、負荷の増減に応じてサーバーとストレージを、それぞれ独立して拡張・縮小できる。

「従来型のDWHは、1つの共有デスクを複数のサーバーでシェアしたり、分散型のローカルストレージを用いたりというスタイルでした。ただ、このスタイルの場合、コストが割高なためスケール面で融通が利かないという課題があり、これがDXの推進を妨げていました。Snowflakeのアーキテクチャは、この課題を解消するために我々がクラウドベースでゼロスクラッチで開発してきました。その実力は多くの方々に評価され、現在では4,000以上のお客様にご利用いただいています」(池田氏)

  • 従来のアーキテクチャとSnowflakeの比較

    従来のアーキテクチャとSnowflakeの比較

高速かつ低価格を実現したSnowflake

Snowflakeでは、サーバー性能をX-Small(サーバー数1)から4X-Large(サーバー数128)まで8段階が用意されている。

例えば、多くのデータを単一処理する場合は、可能な限りスペックの性能が高いウェアハウスサイズを選択する。また、中程度の処理を複数同時に実行する場合には、スペックが低いサーバーを複数利用するなど、必要な処理に応じて柔軟にウェアハウスサイズ(コンピュートリソース)が選択できる。

特筆すべきは、価格が一秒単位の時間課金である点(最低1分〜)だ。Snowflakeでは、サーバー性能が2倍になれば、単価も2倍となる。だが、単純計算すると、性能が2倍になれば処理時間は1/2となるので総課金額は同じとなる。

例えば、大量のタスクが発生する時間帯は高性能なサーバーを選択して、少ないタスク量の時間帯はサーバー性能を下げれば、高速な処理とコスト削減を同時に実現することができるのだ。

  • ウェアハウスサイズ(サーバー性能)

    ウェアハウスサイズ(サーバー性能)

https://docs.snowflake.com/ja/user-guide/warehouses-overview.html

  • サーバー性能を上げても短時間で処理が完了するのでコストはかわらない

    サーバー性能を上げても短時間で処理が完了するのでコストはかわらない

なお、Snowflakeのサポート対象プラットフォームはAmazon Web Services(AWS)、Microsoft Azure(Azure)、Google Cloud Platform(GCP)。2020年2月4日からは、AWSの東京リージョンで利用することができ、全てのリージョンでのサポートも受けられる。DRやBCP対策としても高い効果が期待できる。

  • Snowflakeリージョン設置分布図

    Snowflakeリージョン設置分布図

事例:Snowflakeが選ばれた理由

セミナーでは、Snowflakeのさまざまな導入事例が紹介された。ここでは、その内容をダイジェストで紹介しよう。

1.コマツマイニング

420台のシャベルから毎分で300万件、1日あたり46億件のイベントが発生。Snowflakeによって膨大な量のデータ処理を低価格かつ高パフォーマンスで実施。

2.デボン・エナジー

石油・天然ガスなどのエネルギー企業であるデボン・エナジーでは、400億行のテーブルに対してSnowflakeにて2,000のクエリを同時実行。10秒以下でのレスポンスを達成。

3.PACCAR

トラックメーカーであるPACCARではSnowflakeを採用。「複数のコンピュータとクラスタをオンデマンドでスケールアップ・ダウンできる」ことを評価。

4.アシックス

既存のDWHからSnowflakeに移行した結果、パフォーマンスが約20倍に向上。

なお、より詳細なSnowflake導入事例の詳細については以下のリンクを参考していただきたい。

Snowflake導入事例

最後に池田氏は「他のDWHでは実現できない高パフォーマンス、シンプルさ、ほぼ無制限の同時実行機能、低価格性を兼ね備えたSnowflakeはコンピュートとストレージを完全に分離した、アーキテクチャなので、いわゆるスケールアップ・アウトが非常に容易であり、お互いのコンピュートリソースをコンフリクトしない特徴となっています。30日間$400の無償トライアルにて是非体験していただきたい」と語り、講演を締めくくった。

Snowflakeのデータウェアハウス30日間無償トライアルはこちら

[PR]提供:Snowflake