6ワークロード データウェアハウジング編【2】 Tableau

Snowflakeはデータ利活用を進める人々のプラットフォームとしてさまざまなワークロードを支えている。データ活用のためにはまずその元となるデータを集め、使いやすい形に整えて格納するデータウェアハウジングが不可欠だ。 データウェアハウジングのワークロードとして代表的なものはBI(ビジネスインテリジェンス)ツールなどを活用してデータを可視化していくことが挙げられる。今回はSnowflakeのエリートテクノロジーパートナーであり、すべての人がデータを見て理解できるように誕生し、モダンBIの代表的製品として知られるTableauのリードソリューションエンジニア 増田 啓志氏にTableauとSnowflakeの美しきコンビネーションについてご紹介いただこう。

解説者:株式会社セールスフォース・ドットコム Tableau リードソリューションエンジニア
増田 啓志氏

共著:「Tableauで始めるデータサイエンス」

はじめまして。こんにちは。セールスフォース・ドットコムでTableauのプリセールスを担当している増田と申します。 ふだんは主にパートナー様向けの技術支援を担当しており、Tableauのユーザー会 (JTUG: Japan Tableau User Group)の支援も行っています。 Tableauのユーザー会でも大変お世話になっているSnowflakeのKTさんからご相談をいただき、今回、筆をとらせていただきました。この記事の中ではTableauから見たSnowflakeのメリットや、TableauがSnowflakeを採用した理由についてご紹介できればと思います。

  • TableauとSnowflakeの関係性の説明図版

■Tableauとは

Tableauを既にご存じの方は読み飛ばしていただいて大丈夫です。ここではTableauをあまり知らない方に向けて概要をご紹介させていただきます。 TableauはいわゆるBusiness Intelligence (以下BI)と呼ばれる領域のソフトウェアで、ITに関する専門知識がない方でも直感的にビジュアル分析を行うことができます。多彩なビジュアライゼーション機能やデータプラットフォームとしての機能を有しており、部門導入や全社展開を通して企業がデータドリブンカルチャーを醸成し、データドリブン経営を目指し、実行することを支援しています。 Tableauを導入することのメリットは大きく2つで、1つは生産性の向上、もう1つは情報活用による収益拡大になります。最初は特定部門の生産性向上から始まり、これまで分析が困難だったことが可能になることにより収益が拡大していくという流れです。

  • Tableauを導入することで得られるメリットの説明図版

Tableauがセールスフォース・ドットコムグループとなったことで、AIに強いTableau CRM (旧Einstein Analytics)との連携も進み、Tableau CRMとTableauを組み合わせることで、ビジネス部門の方がデータサイエンスの機能を簡単に利用できるようになりました。誰もがビジュアル分析を行えるようにした Tableau は、今やセルフサービス AI にもイノベーションをもたらす「Tableau ビジネスサイエンス」を提唱しています。つまり、これまでよりさらに多くの人がさまざまな角度から知見を得るために、大量かつ多種にわたるデータを身近に必要としているのです。

  • Tableau の Einstein Discoveryの説明グラフ

■SnowflakeとTableauの関係

少しずつ本題に入っていこうと思います。Snowflakeから見るとTableauは接続先の1つで、SnowflakeはTableauから見るとデータソースの1つかもしれませんが、お互いに互恵関係にあります。 グローバルでは相互にテクノロジーパートナー契約があり、2020年のTableau Conference-ishというイベントのダイヤモンドスポンサーがSnowflakeだったこともあり、Tableau ConferenceではSnowflakeのセッションが常連となっています。最近私の周りでもSnowflakeを検討されているお客様やパートナー様についての話題を聞く機会が確実に増えてきており、両方の製品を活用いただくことでデータ活用を推進しているお客様を身近に感じています。 それに伴い関連する情報も増えてきており、Snowflakeのページの「Using Tableau with Snowflake Best Practices (eBooks) 」やTableauの「Delivering rapid-fire analytics with Snowflake and Tableau (ホワイトペーパー)」等、双方のWebページに組み合わせて使用するためのドキュメントが掲載されています。 なぜTableauのお客様はSnowflakeを選ばれるのでしょうか? 独断と偏見ですが以下3つの理由があるのではないかと考えています。

1.マルチクラウドへの対応
最近はAWSやGoogle、MicrosoftのAzureのいずれかや複数のクラウドを使用されているお客様も数多くいらっしゃいます。同じ会社やグループ内でも複数のクラウドを使用されているようなケースでは、SnowflakeもTableauもマルチクラウドに対応しているのというのは大きなメリットになると考えられます。

2.パフォーマンスとコストパフォーマンスの優位性
あらためて説明するまでもないですが、Snowflakeのパフォーマンスはとても高速です。TableauにもHyperという独自のインメモリのアーキテクチャーがあるのですが、高速ではあるものの大量データを処理しようするとTableau Serverのハードウェア(CPUやメモリ)を潤沢にする必要があり、多くの投資が必要となるケースがあります。「Hyper-charge big data analytics using Tableau (ホワイトペーパー)」 でSnowflakeとTableauのHyperの速度を比較した例があるのですが、データ量が少ない場合はHyperが高速なものの、テスト時のTableau Serverのハードウェアのスペックを見てみると96vCPU、メモリ768GBとかなり潤沢でした。Tableau Serverの標準的な最小構成はCPU 8コア (16vCPU)、メモリ64GB以上なので、そのスペックと比較すると差は明らかです。一方、Snowflakeのウェアハウスのサイズは「L」なので最大で「4XL」まであることを考えると、まだまだ余力がある状態ともいえます。処理パフォーマンスとコストパフォーマンスを考慮するとSnowflakeを活用するのが賢い選択ではないでしょうか。

  • HyperとSnowflakeの比較グラフ

3.簡単にスケーリング可能
Snowflakeはコンピューティングリソースとストレージをそれぞれ必要な分だけ選択することができ、使用した分だけ課金されます。繁忙期で一時的にリソースが必要になったときに簡単に変更できるのは大変ありがたいですよね。

■TableauがSnowflakeを採用した理由

Tableau社内のDBは以前はSQL Serverを使用していましたが、現在はSnowflakeを使用しています。移行先のクラウドサービス選定にあたっては以下の評価軸を中心に比較検討しています。
・パフォーマンス
・スケール
・ガバナンスとセキュリティ
・柔軟性
・シンプルさ
・費用対効果
最終的にデータ量の多い動的な環境では、SnowflakeがTableau社内のニーズを満たすと判断され、採用に至ったとのことです。詳細が気になった方は「Tableau migrates to the cloud: How we evaluated our modernization」をご覧ください。要件の優先順位によってクラウドデータプラットフォームの選択は変わると思いますが、Tableau自身がSnowflakeのユーザーであることも協業やコラボレーションを後押ししていると考えられます。

  • クラウドソリューションの効率性に関するグラフ

■まとめ

シンプルで高速、かつコストパフォーマンスの優位性があるSnowflakeとビジュアル分析のTableauの両方の長所を活用してデータドリブンな企業がますます増えることを願っております。 KTさんの受け売りですがSnowflakeのことが気になった方は「Snowflakeフリートライアルハンズオンラボガイド」がおすすめです。Tableauのことが気になった方は「Tableau Desktopのトライアル」をお試しください。 この記事が少しでも参考になれば幸いです。最後まで読んでいただき誠にありがとうございます。

※本記事はSnowflake、Tableauから提供を受けております。