Snowflakeはこのほど、勉強会を開催し、同社が提唱している「データクラウド」の概念、クラウドネイティブなデータプラットフォーム「Snowflake」の概念、独自のアーキテクチャや従来のデータウェアハウス(DWH)との違い、データクラウドを介したデータ活用のメリットなどを説明した。

冒頭、日本法人代表 カントリーマネージャーの東條英俊氏は、「7月31日時点で、更新契約が1.7倍に増えており、新しいワークロードにもSnowflakeを使おうという顧客企業の動きが現れている。また、12カ月の売上が100万ドル以上の顧客が116社に上っている。日本のビジネスも好調で、顧客数は100社以上に達しており、成長率はグローバルを上回っている」として、同社のビジネスが好調であることを明らかにした。

  • Snowflake 日本法人代表 カントリーマネージャー 東條英俊氏

既存のDWHが抱える課題とは?

続いて、プロダクトマーケティングマネージャーのKT氏が、Snowflakeの技術解説を行った。同氏は、「企業では、データが業務ごとに最適化されて、サイロ化されているが、これがデータの活用を難しくしている。そこで、われわれはもっとデータを柔軟に使える方法があれば、この問題を解決できるのではないかと考えた。クラウドの利用が増えてきたことで、柔軟性は巻いているが、次はクラウドにまつわるデータサイロができている」と、データ活用にまつわる課題を指摘した。

  • Snowflake プロダクトマーケティングマネージャー KT氏

データ分析基盤の歴史は、オンプレミスのDWH(データウェアハウス)から始まったが、ユーザーのアクセス数や非構造化データの増加により、対応しきれなくなってきた。そこで、リソースを柔軟に拡張できるクラウドベースのDWHが出てきたが、「リソースは柔軟に使えるようになったが、管理に手がかかることには変わりなかった」とKT氏。

さらに、データベースに格納できないデータを管理するために、データレイクやHadoopが登場し、さまざまな種類のデータを格納できるようになった。ただし、ここでも専門知識が要求されるため、データの活用はそれほど進まなかったことから、「われわれはもっとデータ活用を進めるため、新たな挑戦をすることにした」とKT氏は語った。

  • データ分析基盤の歴史

データクラウドの3つの特徴

そこで、Snowflakeが作り上げたテクノロジーが「データクラウド」となる。KT氏は「データクラウドはデータベースではない。企業やデータプロバイダーをそれぞれのビジネスに最適なデータにつなぐネットワーク」と述べ、データクラウドの3つのメリットを挙げた。

1つ目のメリットは「アクセス性」だ。データクラウドは、組織内のアクセスに加えて、エコシステムのデータ、サードパーティのデータのアクセスまで可能にする。「組織内のデータだけで、ビジネスの意思決定は可能だろうか」とKT氏。

2つ目のメリットは「ガバナンス」だ。KT氏は、「データをすべて守る必要はないが、所有しているデータを把握する必要はある。データを理解して保護するサイクルが必要」と述べたが、データクラウドはこうしたサイクルを実現する機能を備えている。

3つ目のメリットは「アクション」だ。データクラウドは、製品開発チーム、データサイエンティスト、ビジネスユーザー、アナリストなど、社内のさまざまな立場の人が共通のデータを活用して、コラボレーションすることを可能にする。

データ共有にまつわるムダを排除するSNOWGRID

KT氏は、「データクラウドはプラットフォームとコンテンツから構成される。われわれが提供するのは、プラットフォームのSnowflake。コンテンツは、データを所有しているさまざまな人に提供してもらいたい」と述べた。

データクラウドのプラットフォームに必要な要素として、KT氏は「どんなワークロードも迅速に処理する」「求めたとおりに動くだけでいい」「本当に大切なことにつながる」の3点を挙げ、Snowflakeはこれらを備えているという。

KT氏は、Snowflakeの技術的な特徴として、「伸縮性のあるエンジン」「インテリジェントなインフラストラクチャ」「SNOWGRID」を挙げた。これらのうち、「特に知ってもらいたいのがSNOWGRID」と、KT氏は話した。SNOWGRIDはデータとストレージを分けて持つことで、ETLを使わずにデータ共有を実現するテクノロジーだ。データのコピーが行われないので遅延もなく、データの移動・コピー・統合のコストも不要だ。複数のDWHを動かせるため、別なDWHの影響も受けないという。ストレージも多数のアクセスが可能なため、リソースの競合が発生しないそうだ。

加えて、KT氏は「SNOWGRIDを使えば、チューニングやセキュリティにかかる手間も省くことができる。また、AWS、Microsoft Azure、Google Cloud Platformの各リージョンをサポートしているので、どのクラウドでも同じ環境が利用でき、他のクラウドのユーザーとデータ共有も可能」と、SNOWGRIDによって得られるメリットを説明した。

  • 「SNOWGRID」の特徴

最後に、KT氏は、データクラウドを介したデータ共有のメリットとして、データを転送することなく、自社のデータを安全な形で相手に参照させることができる点を紹介した。そのため、Snowflakeデータマーケットプレイスで、データを売ってビジネスをすることも可能になる。既に16以上のカテゴリーにおいて、150以上のプロバイダーがマーケットプレイスに参加している。日本からもウェザーニュースが参加しているそうだ。そして、KT氏は「日本企業もデータクラウドの波に乗り遅れないでほしい。データを共有しながら、ビジネスや社会貢献を加速してほしい」と呼び掛けていた。