私たちや機器が生み出すデータは2年間で倍増し、その大半がオフィス文書、電子メール、写真、画像、動画、音楽、ログなど「非構造化データ」です。データベース等に使う構造化データとは異なり、これらのデータはまさに「ありのまま」と言えます。

私たちは、パソコンやスマートフォン等のデータ格納スペースが一杯になれば、新しいデバイスに買い替えたり、ホームNASに移したり、クラウドストレージに預けたりし、空きスペースを確保することでしょう。この作業は企業ITのインフラともなると簡単ではありません。担当者は徹夜作業も含む力技か、高額な費用で解決せざるを得ません。

こういった作業や費用を軽減するための解決策として、「ありのまま」データを大量に保存するITインフラが求められています。特に、その仕組みを備えるオブジェクトストレージの技術と製品が注目を集めています。企業において、そんなITインフラを選択したい場面を紹介したいと思います。

決して捨てられないデータが増え続け、貯まり続ける

データが増え続けるのは、それを捨てられない重大な理由があるからです。それはいくつかあります。

データの価値が高い

業種や企業・組織のサイズにかかわらず、研究開発における実験等のデータや製造開発における設計データは大量に保管され続けています。それは長年に渡る研究・開発投資の成果であり、価値も単価も高いデータです。大切に保管し続ける結果、軽くペタバイト級に達することも多いようです。データが増える都度、データを保管するストレージ装置を買い足していくと、多数のストレージ装置が乱立するサイロになったり、データ移行に苦労したりといったことが起こります。

データは正しい事業活動を証明する

コンプライアンスの必要性から、電子メールやファイルの他、サーバのアクセスログは、何年間にも渡り保管されています。こういったログは、機密ファイルが電子メールに添付され外部送信されていないことを確認するためや、法的な要請に対し提出するために使用されます。正しい事業活動であることを証明するためには、ログまでも大量に保管し続けることが必要になります。最近ではブロードバンドやモバイル環境が整い、モニターカメラも小型化・高性能化しています。さまざまな場面で映像データを大量に保存することも増えています。

あるイベントにおいて、5分間ごとにモニター映像データを保存した例

(注)5分間間隔に十数メガバイトのデータを格納し続けています。

万が一の故障や災害への備え

データベース処理するデータやファイルサーバのファイルは、機器の故障等で失われたり、アクセス不能になっては困ります。このような万が一に備え、定期的にデータはバックアップされています。仮想サーバを利用する場合には、いつでも復元できるよう、仮想サーバのイメージそのものがバックアップされています。また、私たちは東日本大震災を経験し、複数のデータセンターや地域拠点に分散させて、データ保管しておくことの重要性を学びました。そのためには、ネットワークを経由し、複数のデータセンターにデータを複製・分散配置しながら同じ環境を整え、維持し続けることが大切です。安全・安心のためには必然的に保存されるデータ量も倍数で増加することになります。

いつかは使うかもしれない

データを整理し長期間に渡り安全保管するアーカイブは、テープ媒体に記録され倉庫等に格納されます。データ保存コストという点では安価ですが、読み出すために倉庫から回収したり、必要なデータを探し出す手間や時間がかかります。テープは劣化するため、数年ごとに記録し直すといった作業も必要になります。こういった不便さの解消のため、当然のようにアーカイブ・データもオンライン化され蓄積されてゆきます。

データの「全て」は外部に預けられない

最近、代表的なクラウドストレージサービスであるAmazon S3だけではなく、ニフティの「ニフティクラウドストレージ」やNTTコミュニケーションズの「Bizホスティング Cloudn Object Storage」等、日本の事業者によるクラウドサービスが充実しています。クラウドにデータを預けておけば、さまざまなデバイスから時間、場所を問わず、読み出すことができます。データが増え続けても、容量制限のないクラウドストレージサービスであれば、預けるデータ量が指数的に増えても、事業者側の設備増強を待つ必要もありません。

しかし、企業や組織によっては外部にデータを預けられない事情が多々あります。それは、企業や組織の使命や、法的な要請に基づく場合だけではなく、個人情報や機密情報は企業自身で厳重に管理するというポリシーに基づく場合もあります。こういったデータは長年に渡り内部に厳重に保管され、その結果、増え続けていきます。

最近では、データの種類や性質に応じて、経済的で柔軟性が高い「共有」のパブリッククラウドと、自社「専有」のプライベートクラウドやオンプレミスの環境を使い分けてデータを保存したいというニーズも顕著になっています。

パブリックとプライベートクラウド、オンプレミス環境の使い分け

データが増えることは楽しく、活用できれば新たなビジネスを創り出す

データが増えるのは、捨てられない、預けられないといった受け身の理由からだけではなく、むしろ、それが楽しいからであり、活用できれば新たな事業機会にも繋がるからです。

楽しいから増えてしまう

ソーシャルネットワークで、多くの好意的な反応があるのは楽しいものです。そこに公開するために、わざわざ旅行に行き、高級レストランで食事をし写真を撮るといったケースも増えていると聞きます。ひと昔前、写真は厳選してプリントするものでした。いまは、ひとりがデジカメやカメラ内蔵デバイスで撮影した写真を、オンラインで多くの人に配り共有します。ひとつの写真をパソコン、ホームNASだけではなく、クラウドにも複製し保存したりもします。その結果、データが雪だるま式に増えていきます。

新しい事業機会を創り出す

ビッグデータ分析と言われるように、利用者のアクセスや検索履歴、購買動向、ソーシャルメディアへの投稿等に関する大量のログを収集し、年齢、性別、時間、天候、サービスや製品の売上等との相関を分析し、傾向を把握し、製品開発に役立てたり、商品ラインアップを見直したり、対象者の趣味嗜好に合わせた「おすすめ」が行われたりしています。統計理論に基づきサンプリングした時代には、捨てられていたり、使われなかったり、多すぎて手に負えなかったデータも「宝の山」となり、日々山の高さを更新してゆきます。

そもそも、ソーシャルメディア、Eコマース、オンラインゲームを始めとする多くのWebサービスは、コンテンツ数が多いことや、それぞれがリッチであることがビジネスの重要な成功要因です。データを増やすことへの動機は高まる一方です。

「Let Data Go~ありのままで~」データを保存するオブジェクトストレージ

ここまで説明してきたように、データは捨てられず、外部に預けられない事情もあり、その一方で増やすことへの強い動機もありで、ますます増え続けます。そうであれば、手間や費用をかけず、できるだけ簡単なデータ管理を目指したいものです。

そのひとつの解がオブジェクストレージの採用です。それは「ありのまま」にデータを増やすために適した仕組みを備えているからです。オブジェクトストレージは、ファイルストレージにおけるディレクトリのような階層構造がなく、オブジェクトと呼ばれるデータ(ファイル)はフラットに格納されます。それぞれのオブジェクトはURLで認識され、またメタデータ(属性情報)が付与されます。そのため、階層構造の頂点となる物理的なデータの格納容量や場所、その属性管理を気にせず、いわゆる「バケツ」にデータを放り込むかのようにデータを格納できます。

オブジェクトストレージのイメージ

この構造により、データが増え続けても、ハードウェアを置換するのではなく、それを追加してゆくだけで全体の容量を拡張できるスケールアウトや、複雑な階層構造に影響を受けることなくネットワーク経由で広域に渡る複数データセンターへのデータ複製・分散配置を経済的に、効率的に行うことができます。

さいごに

大ヒットとなった「アナと雪の女王:原題(Frozen)」の主題歌「Let It Go ~ ありのままで ~」の歌詞のように、「わたしは自由よ」と言わんばかりの勢いで「ありのままの姿」を見せたデータが増えています。ただし、ここまでご紹介した迷場面のいずれの対処においても、処理性能の高い高価なストレージ装置である必要はなく、データが増えれば柔軟に容量を拡張でき、大量であっても経済的に管理できることが重要となります。

そのためには、経済性の高い汎用的なサーバをハードウェアに使う、Cloudian HyperStoreのようなオブジェクトストレージのソフトウェア製品が最適です。特に、Cloudian HyperStoreであれば、サーバ2台という小規模から利用開始でき、ソフトウェア製品としても、アプライアンス製品としても入手できるため、事業者が提供するクラウドストレージサービスだけではなく、一般的な企業ITのインフラストレージとしての活用にも適しています。

著者紹介:本橋 信也 クラウディアン株式会社 取締役 COO
日本とシリコンバレーを開発拠点としてグローバルに製品展開するクラウディアンに勤務。前職の大手通信事業者時代を含め30年以上に渡り経営戦略、経営企画、事業開発を担当。著書に「NOSQLの基礎知識 ビッグデータを活かすデータベース技術:リックテレコム刊」がある他、数多くの専門誌に寄稿。