「スマートデータ」「スマートサポート」実現に向け
「CLOUDIAN HyperStore 5.1」を発表

クラウディアンは2015年2月12日、サーバをハードウェアに使いオブジェクトストレージを構築できるソフトウェアの新バージョン「CLOUDIAN HyperStore 5.1」を発表した。同社は、新たに米ホートンワークス社と提携し、分散データ処理ソフトウェア「Apache Hadoop」と連携することを検証し、Hadoopアプリケーションを何ら問題なく活用ができることが公式に認定されている。

Hadoopの標準的な分散ファイルシステムである「HDFS(Hadoop Distributed File System)」は、Hadoopのためのデータ保管を目的としたものであり、データストレージを代替するようなものではない。そのため、実際のHadoop分析の際には、ストレージプールに蓄積されたビッグデータをHDFSにコピーする必要がある。またHDFSに蓄えたデータを他の目的に利用する場合には、別のストレージ装置にデータ移動する必要があった。

一方、CLOUDIAN HyperStoreは、Amazon S3に準拠したAPIを備えており、さまざまなアプリケーションと連携できる。HadoopはS3 APIを経由したデータ移動に対応するため、CLOUDIAN HyperStoreをデータの保管場所として活用することで効率のよい分析が可能となると同時に、共有も容易となる。

つまり、スケールアウト型オブジェクトストレージのCLOUDIAN HyperStoreであれば、汎用サーバを用いたシンプルで拡張性の高いHadoop対応のオンプレミスストレージを構築できる。CLOUDIAN HyperStore Readyに対応したアプライアンスなどを活用すれば、容易にスモールスタートできるというメリットもある。

クラウディアンによれば、CLOUDIAN HyperStoreとHadoopとの連携は、ビッグデータを「スマートデータ」とすることを加速すると説明する。また同社は、スマートデータを活用することによって、CLOUDIAN HyperStoreのユーザーに対してプロアクティブなサポートを提供する「スマートサポート」を実現しているという。

そこで、米クラウディアンのCMOを務めるPaul Turner氏と、クラウディアン グローバル テクニカル サポート プリンシパル サポート エンジニアを務める佐藤剛宣氏に、スマートデータとスマートサポートについて話を伺った。

収集・格納から分析まで、効率のよい分析を実現

── スマートデータとはなにか。どのような利点があるのか

米クラウディアン CMO Paul Turner氏

Turner氏 IDCの予測によれば、世界の情報量は2020年に40ZBという数字に達すると見られています。そうした状況に向けて、いわゆる「ビッグデータ」を格納するために、拡張性に優れた大容量のストレージが求められるようになってきました。さらに現在、そうしたビッグデータを基にした「分析」が注目されています。

「IoT(モノのインターネット)」や「M2M(Machine to Machine)」の分野においては、多数のデバイスからデータを取り込み、高速に分析することが求められます。そのためには、拡張性に優れ、効率よく分析できる“賢い(スマートな)”ストレージが必要です。

スマートデータとは、単なる大容量の情報にすぎないビッグデータに、分析に必要となる要素を加えることによって、“賢く(スマートに)”しようという考え方です。当社のCLOUDIAN HyperStoreは、このスマートデータを実現するストレージシステムです。

クラウディアン グローバル テクニカル サポート プリンシパル サポート エンジニア 佐藤剛宣氏

佐藤氏 従来のブロック型ストレージは、データを「ブロック」として格納し、“意味”を持たせることはできません。そのデータがどのようなものか、どういった特性を持つかは、ストレージの外にあるアプリケーションなどで管理する必要があります。

一方、オブジェクトストレージ技術は、データを「オブジェクト」として格納したうえ、属性情報である「メタデータ」も保管しています。このメタデータを活用することで、高度なデータ管理を可能としています。

このデータに意味を持たせる“スマートデータ”の考え方は、高速かつ高度な分析においては非常に重要です。

通常の分析では、“ある期間のデータ”であるとか、“対象となるシステムを限定したデータ”であるとか、何らかのフィルタが必要です。これまでは、すべてのデータを読み出したうえでフィルタをかけていました。

オブジェクトストレージであれば、事前にフィルタをかけることが可能となります。しかもCLOUDIAN HyperStoreとHadoopの組み合わせであれば、収集・格納から分析までデータを複数のシステム間に移動する必要がないため、非常に効率のよい分析が実現できます。

3つの特徴を備えたユニークなストレージ

── CLOUDIAN HyperStoreを活用するメリットとは

Turner氏 3つのメリットがあります。

1つ目は、非常に拡張性にすぐれていることです。データの増加にともなって、ノードを追加するだけで拡張できるのは大きな特長です。需要とともにシステムを拡張できるため、従来のストレージシステムのように、需要に先立ちシステムを事前設計する必要がありません。需要に応じたシステム容量を用意できることは、コスト削減に大きく貢献します。

2つ目は、「レプリケーション(Replication)」と「イレジャーコーディング(Erasure Coding)」を同一のプラットフォームで実現していることです。お客様はコストとパフォーマンスのバランスをとりながらデータを格納する最適な方法を選択することができます。

単に複製を作成するレプリケーションはパフォーマンスに優れるものの、大きなオーバーヘッドが発生します。イレジャーコーディングは、ほとんどディスク効率を低下させずに、高い耐障害性を実現できます。CLOUDIAN HyperStoreであれば、データ保護のために、パケット単位でイレジャーコーディングかレプリケーション(ミラーリング)の選択が可能です。

3つ目は、地域をまたがった分散(Geo Distribution)が可能である点です。

特にIoTの分野では、世界各地に配置されたデバイスからログが収集されます。CLOUDIAN HyperStoreであれば、米国のデータは米国のデータセンターに、欧州のデータは欧州のデータセンターに、日本のデータは日本のデータセンターに格納しておきながら、それらのデータセンターに分散したデータを、1つのストレージシステムとして効率よく扱えます。

CLOUDIAN HyperStoreは、こうした3つの特長を兼ね備えた非常にユニークなストレージシステムなのです。

Hadoopとの連携により「スマートサポート」を実現

── スマートデータによって実現される「スマートサポート」とは

佐藤氏 従来の一般的なユーザーサポートは「リアクティブ」、すなわち何かトラブルが発生したときに初めて実行する対処療法にすぎません。ビッグデータ解析の技術によって、トラブルを未然に防ぐ「プロアクティブ」なサポートが期待されるようになりました。

ところが、昨今は仮想化技術やクラウドの普及によって、システムが非常に複雑化しています。プロアクティブなサポートを実現しようと思っても、ログの量は膨大なため人が状況を的確に判断することは難しく、結果的にサービス品質が低下しています。

それをサポートするのが、Hadoopに代表される分析システムですが、ただ分析の機能が存在するだけでは不十分です。たとえば、シャーロックホームズのように事件が起こってから犯人を捜し出すように、トラブルから原因を突き止めるのは比較的容易ですが、“原因となりうるもの”からトラブルを予期するためには、膨大な情報を分析する必要があります。

CLOUDIAN HyperStoreであれば、膨大なデータを比較的安価に格納しておくことが可能です。またHadoopとの連携によって、効率のよい分析が可能となります。

当社では、この機能を活用し、ユーザーが利用しているCLOUDIAN HyperStoreからインターネット経由でお客様が利用するCLOUDIAN HyperStoreのログを収集して、プロアクティブなサポートを実現しています。それがクラウディアンの「スマートサポート」です。

特にサービスプロバイダーなどは、多数のエンドユーザーを抱えており、各ユーザーは多数のシステムログを保有しています。しかし、それらのデータ量は多く、活用に苦労しているというのが現状です。今後は、当社自身が導入事例となって、スマートサポートの仕組みを提供できると考えています。