6ワークロード データウェアハウジング編【1】 ジール

Snowflakeはデータ利活用を進める人々のプラットフォームとしてさまざまなワークロードを支えている。データ活用のためにはまずその元となるデータを集め、使いやすい形に整えて格納するデータウェアハウジングが不可欠だ。 データウェアハウジングのワークロードとして代表的なものはBI(ビジネスインテリジェンス)ツールなどでダッシュボードを作成し、ビジネス意思決定に活かすことだ。今回はBI領域を専業で手がけるシステムインテグレーターとして数多くの企業のデータ活用を支援しており、Snowflakeのサービスパートナーでもある株式会社ジールのビジネスディベロップメント部 マネージャー 亀井 美佳氏にデータウェアハウスの基本と、これまでの課題をSnowflakeがどのように解決していくのか、BI専門家ならではの視点でご紹介いただこう。

解説者:株式会社ジール ビジネスディベロップメント部 マネージャー 亀井 美佳氏

新年度に入りお客様から「DX推進部ができました、データ活用について相談できますか? 」と声をかけていただく機会がふえました。DXを支えるデータ基盤には欠かせないのがデータウェアハウス。けれども活用には課題もあります。データウェアハウスがいま注目される理由と4つの課題、そして解決の鍵をご紹介します。

■データウェアハウスとは?

そもそもデータウェアハウスとは何でしょうか。直訳すると「データの倉庫」。ビジネスの状況を分析して意思決定するためのデータを貯める場所です。たとえば「新商品がヒットしている、仕入れを増やしたほうがいいか? 」を判断するには売上と在庫データが必要ですし、「在庫回転率が低い製品の生産計画を見直したい」というときには生産実績データも使います。データがなければビジネスは回りません。その企業の資産ともいえるデータを保管する倉庫、それがデータウェアハウスです。

■データウェアハウスに入れるデータはどこからやってくる?

では、倉庫に入れるデータはどこから来るのでしょうか? ひとつは日々の事業活動から生まれる社内のデータです。たとえば店舗のPOSレジのデータ、工場の稼働ログ、取引先との受発注データなどが用途別のシステムに記録されます。もうひとつは、会社の外にあるデータです。たとえば、気象庁の天気データで来客数を予測したり、SNSの口コミ情報でマーケットを分析したりと、インターネットの普及により企業の外で生まれるデータも意思決定に使われる事例が増えてきました。

■データウェアハウスは何のためにある?

これらのデータは多種多様、しかも大量です。データをもとに意思決定するためにはデータを集めて貯めて使える仕組みが必要です。また、会社や組織は同じ目標に向かって活動しているので、みんなが同じデータを見て判断できることも重要です。そこで、組織が意思決定するためのデータを貯める場所としてデータウェアハウスを使うのです。

■使えるデータ保管のしかた

しかし、ただ貯めればいいというわけではありません。整理整頓されていないカオス状態の倉庫では欲しいデータが見つかりません。また、古いデータは使い物にならないので鮮度も大事です。「何のためにそのデータを使うのか」、その用途と目的から逆算して、使えるデータをデータウェアハウスに入れることが肝心です。 では、目的から逆算するにはどうしたらよいのでしょうか? 定番ですが5W1Hに当てはめて考えるのがおすすめです。データを見る人は社長なのか現場の責任者なのか、毎日見るのか月末に見るのか、全体像を掴みたいのか詳細を知りたいのか、何を判断するためにどのデータを見たいのか。目的をクリアにして、その目的を満たしてくれるデータを集めます。

けれども、言うは易く、行うは難し。今年の2月にジールが実施したお客様の課題アンケート結果の1位は「データが分散しているためデータ統合をどう進めてよいかわからない」でした。データウェアハウスの活用には苦労しているという話をよく聞きます。
  • 「データ活用に関する課題」ジール調査(2021年2月 n=114)

■ データ活用を阻む課題とは

実際にどんな課題が立ちふさがるのか4つのケーススタディから理想と現実を見てみましょう。

1.データが分散していて欲しいデータが手に入らない
「全社横串で経営指標の進捗を見たいのにデータが部門に散在している。仕方がないので各部門からExcelを集めて実績を手で集計している」というお悩み相談はよくいただきます。
分散したデータを集めるのは手間も時間もかかるうえにミスも起きがちです。データは1箇所でまとめて管理できることが理想です。


2.肝心なときに処理が遅い
月末・月初はシステムのレスポンスが悪くなる、という経験はないでしょうか? 最もデータを見たいこの時期に処理が集中してシステムが追いつかなくなるという問題です。
近年のデータ量の急増もこの問題に追い打ちをかけています。数年前に構築したシステムではパワー不足になっているのです。
対策としてユーザーごとにデータを小分けしたら数千個もできてしまって管理が大変になった、という例もあります。
とはいえ、ピークにあわせて最強システムを用意すると普段はそのリソースが余ってしまいます。「常に快適なレスポンス」は理想ですが、実現するのは簡単ではない、悩ましい課題です。

3.システムのメンテナンスが複雑で煩雑
システム担当者は、複雑化したシステムの運用管理やパフォーマンスチューニング、データのバックアップにセキュリティの確保、それに加えてユーザーからのデータ作成依頼と多忙です。
「もっと運用が楽な仕組みがあったらいいのに……」と思いながら日々の仕事に追われて戦略的なシステム構築に取り組めない悩みがあると聞きます。


4.データウェアハウスは作ったら終わりではない
「変化するものだけが生き残る」という言葉はデータウェアハウスにも当てはまります。ビジネスの方針が変われば判断に使うデータも変わります。
データウェアハウスは作ったら終わりではないはずです。けれども、従来型の投資サイクルではハードウェアは5年償却のケースが多いため、クイックなシステムの変更はなかなかできないという現実もあります。


これらの従来型データウェアハウスの課題を解決するべく作られたのがSnowflakeです。

■Snowflakeはデータウェアハウスの進化形

Snowflakeは最新技術を駆使してゼロからスクラッチで開発された次世代のデータ活用を支えるプラットフォームです。進化の過程で環境適合して突然発生するミュータントのようにSnowflakeは生まれました。クラウド時代に最適化されたアーキテクチャが従来型データウェアハウスの課題を解決します。

■もうデータの分散に悩まなくていい

Snowflakeはクラウドサービス型プラットフォームなので、データをワンストップで安全に共有できる、つまり全員が同じ値を見て意思決定することができます。部門別に分析用システムを持つ必要もなくなるので、データが分散する問題を解消します。また1箇所で集中的に管理できるため、安全性が高まりガバナンスを効かせることができます。

■高速、そして、コストコンシャス

Snowflakeはサーバーサイズを柔軟に伸縮できます。「償却するまでシステムを変えられない」という縛りから開放される「その手があったか!」と思ってもらえるような仕組みです。たとえば、営業部の売上データ参照にはSサイズ、データ分析チームにはXLサイズとTシャツを選ぶようにクリックひとつで最適なサーバー性能を割り当てられます。アクセスが集中したときは自動で性能がスケールするので、いつでも快適に利用できます。さらに「使った分だけ支払う」スタイルなのでコストが最適化されます。

■シンプルだから運用が楽

SnowflakeはSaaS型サービスなので従来必要だったデータウェアハウス用のインフラの設計・調達・構築・運用といった作業がいりません。これまで複雑になりがちだったパフォーマンスチューニングやバックアップの手間も削減できます。データウェアハウスのメンテナンスがシンプルになることで、情報システム部門はより本質的なシステム戦略に注力できるようになるのです。

■データウェアハウスも変化し続けるために

ビジネスが変化するとき、必要なデータも変化します。常に状況にフィットし続けるためには「目的を決めて、データを集めて、整えて、活用する」というPDCAのサイクルを素早く回せる仕組みが必要です。

そのためには変化に柔軟に適応できる使い勝手の良さと万全の安全性を併せ持つデータウェアハウスを選択することが成功の鍵となります。ニューノーマルという言葉も生まれた転換期の今。従来型データウェアハウスの課題を解消するSnowflakeで、次世代のデータ活用に取り組んでみませんか?

Snowflake 紹介セミナーとハンズオンを定期開催しています。
Snowflakeのことをもっと知りたい、触ってみたいという方は是非ご参加ください!

詳細は>>こちら から

※本記事はSnowflake、ジールから提供を受けております。

[PR]提供:Snowflake