ガートナー ジャパンが6月14~15日に都内で開催した「データ & アナリティクス サミット 2018」では、グーグル・クラウド・ジャパン Google Cloud カスタマー エンジニアの寳野雄太氏が登壇。「クラウドで実現する、本質的なセキュリティを備えたデータ活用基盤」と題した講演を行った。

GCPを支える技術

IaaSからPaaS、SaaSまでをフルレンジで提供するクラウドサービスとして国内でも存在感を増し始めている「Google Cloud Platform(GCP)」。寳野氏は、GCPのなかでもデータの分析と洞察にフォーカスし、企業が本来のビジネスに集中できるようにする上で、GCPがどう役立つか、また、そのためのセキュリティ基盤はどう構築されているかを紹介した。

グーグル・クラウド・ジャパン Google Cloud カスタマー エンジニアの寳野雄太氏

GCPを支えているのは、Googleが創業以来、改善し続けてきたデータセンターやセキュリティの基盤だ。データセンターはチップ以外は自社開発されており、サーバだけを整然と並列に並べ、ソフトウェア技術でコンピュートからストレージまでを構成している。投資額は年間3兆円に達するという。

「データセンターの写真を見ると、どこか違和感を感じる方も多いと思います。通常データセンターはラックに2Uや4Uの機器がまばらに存在するものですが、Googleにはそれがありません。同じ大きさの機器が整然とラックに集積されています。数千台のサーバで並列分散処理をしているためです。Googleが提供している検索やマップなどと同じ技術基盤をGCPにも使っています」(寳野氏)

1つのサーバをスケールアップするには限界がある。そこでGoogleでは複数分散処理を行い、データセンター全体を1つのスパコンのように扱う。最近では、サーバのなかでコンテナを稼働させ、ユーザーからの要求があれば数千台のコンテナを素早く立ち上げ、必要がなくなると立ち上げたコンテナを即壊すという作業を実施している。

「GCPのなかでデータアナリティクスを提供しているサービスとして、非構造化データを含めてデータを蓄積するデータレイクに相当するものと、データレイク上のデータを分析するDHWに相当するものがあります。それぞれ、『Google Cloud Storage』というオブジェクトストレージと、『BigQuery』というSQLに対応したクラウドDWHです。また、DWHから返されたデータをわかりすやく可視化するためのGoogleスプレッドシートを提供する『Google Data Studio』もあります」(寳野氏)

Google Cloud Storageは「11 nine」の可用性を持つ従量課金型の統合オブジェクトストレージだ。コストパフォーマンスが高く、「クラス」というデータのタイプを自動で切り替える機能で、コストを自動で最適化できることが大きな特徴となっている。

「クラスには、Webコンテンツの配信や1週間に1回程度アクセスするアクティブなストレージ用途に適している『Regional』、年に1度以下のアクセスでアーカイブ用途に適している『Coldline』などがあります。RegionalはGBあたり月0.02ドル、日本円で2円程度。取り出し費用は無料です。Coldlineはさらに安く保存費用はGBあたり月0.007ドル、取り出し費用は0.05ドル。どのクラスも取り出し開始まで数ミリ秒で可能です」

このクラスはjsonフォーマットの設定ファイルで変更可能で、例えば30日以上経過しているデータをColdlineに設定してアーカイブしたり、新しいバージョンが3つ以上存在しているアーカイブオブジェクトを自動削除したりできる。この自動設定変更可能なライフサイクル管理により、ストレージコストを最適化できるわけだ。

「こうしたことができるのも、Googleがファイルシステム、ハードウェア、ストレージ、ネットワークを全て自社開発しているためです」と寳野氏。これらは、ほかのグローバルクラウドプロバイダーでもなかなか見られない特徴となっている。