データ爆発により"保存分け"が求められる時代に

スマートデバイスやソーシャルメディア、モノのインターネット(IoT)の本格的な普及に伴い、デジタルデータの総量は急激に増加している。米IDCによれば、2020年には40ゼッタバイトに及ぶとみられている。

こうしたデータ爆発時代にあって、デジタルデータをいかに安全かつ低コストで保存するかが企業の重大な課題となりつつある。データを保存するストレージシステムには、ハードディスクやSSD(ソリッド・ステート・ドライブ)搭載ストレージ、SANやNASなどのネットワークストレージ、そしてテープストレージなどのさまざまな選択肢が存在する。コストを抑えて最適なデータ保存を実現するには、保存するデータに応じたストレージシステム・デバイスを使い分ける必要があると、日本ヒューレット・パッカード(日本HP)エンタープライズグループ事業統括HPストレージ事業統括本部 ストレージマーケティング本部の林 正記氏は指摘する。

エンタープライズグループ事業統括 HPストレージ事業統括本部 ストレージマーケティング本部 林正記氏

「ディスクアクセスの高速化の効果が高いリレーショナルデータベースやHTMLレスポンス、クライアント仮想化などのアプリケーションには、アクセスが高速なフラッシュストレージ(SSD)の利用が進んでいます。一方でWebのアクセスログや過去のPOSデータ、過去のコンプライアンスのためのメールデータ、ゲノム研究、気象データのような大量で、ほとんどアクセスされない、いわゆる"コールドデータ"の保存には、SATAディスクのようなデバイスが使われているケースが多いです。」

「高速ストレージは、今のところアプリケーションを選んだ限定的な需要ですが、安価なデバイスへの保存という需要は、全ての企業の課題になっています。データ量の増大を背景に、単にディスクになんでも保存しておくことが、全体最適ではなくなっています。アクセスが多いものはより速く、アクセスが少ないものはより安く、データの種類や利用用途に応じて、“保存分け”することが全体最適のために必要になっています。」

IDC Japanが2014年2月に発表した「国内エンタープライズストレージのメディアタイプ別市場予測」によると、2012~2017年の国内エンタープライズストレージシステム(外付型と内蔵型の合計)市場のメディアタイプ別売上額予想は別表(図1)のようになり、SSDを搭載した高速なストレージ(I/O intensive)や性能を重視したハードディスク搭載ストレージ(Performance optimized)と比較し、低コストで大容量データの保存に適したストレージ(Capacity optimized)が最も高い成長を続けると予測されている。企業はストレージシステムの高速化よりも、容量単価の低減化を優先していることが明らかになった。

図1 「2012~2017年の国内エンタープライズストレージシステム(外付型と内蔵型の合計)市場のメディアタイプ別売上額予想」(IDC Japan)

TCOやROIに優れたテープストレージ

エンタープライズグループ HPストレージ事業統括本部 テクニカルスペシャリスト 井上陽治氏

容量単価を追求したストレージシステムとして、最もコストパフォーマンスに優れたテクノロジーがテープストレージだと、日本HPエンタープライズグループ HPストレージ事業統括本部テクニカルスペシャリストの井上陽治氏は指摘する。

「先ず第一に、単純なデバイスの比較だとコストは1/10程度ですから、テープのコストはディスクと比になりません。第二に、ハードディスクやSSDと異なり、テープは利用しない時に電気代がかかりません。最先端のデータセンターでも空調を含めた電気代の低減は大きな課題です。ディスクの電気代だけで、テープトータルコストを上回るという事例もあります。また、ハードディスクは5年ほど使用するのが一般的ですが、テープストレージは適切な環境であれば30年間は利用できます。こうしたTCOやROIの観点から、長期間にわたりほとんどアクセスされない"コールドデータ"の保存にテープストレージを再検討している企業が増加しています。」

「誤解されているのは、テープは遅いと思われている点です。テープはランダムアクセスには向いていませんが、連続して書き込みや読み出しを行うシーケンシャルアクセスには優れており、そのスピードはディスクを上回ります。一度保存して頻繁には読み込みを行わないデータのアーカイブにはテープストレージが適していると言えます。」(井上氏)

確かに、テープの特徴を改めて確認すると、1回書いてしまったらアクセスが少ない"コールドデータ"用途には、テープストレージはディスクに比べてはるかに向いていると言えそうだ。

図2 テープとディスク、デバイスによるストレージの特性

テープにディスク同等の操作性を与えるLTFS技術

TCOやROIに優れたテープストレージだが、バックアップデータの保存先というイメージがある。そして、テープに保存されたデータは、WindowsやLinuxなどが提供する一般的なファイルシステムで管理されていないため、データをディスクに展開する際にはバックアップアプリケーションを使用する必要がある。だが、こうしたテープストレージの課題は「LTFS」と呼ばれる共通化技術で解消できるという。

「LTFSにより、ユーザーはUSBメモリを使うような操作性でテープとデータのやり取りをすることができます。テープの記録領域を論理的にメタデータと実データの領域に分け、あたかもファイルシステムのように管理することが可能です。そのためハードディスクやSSDと同じように、ファイルをドラッグアンドドロップしてテープストレージに保存したり、ダブルクリックで実行したりすることも可能です。さらに言えば従来ファイルシステムしか扱わなかった階層管理ソフトウェア等によるアクティブアーカイブが可能になり、無秩序に増え続けるデータの階層管理自動化が、また一層幅を増したことになります。」(井上氏)

図3 LTFS(Linear Tape File System)操作性

「LTFSが与える効果は思いの外強力です。バックアップデバイスとしての価値しかなかったテープが、オリジナルデータのアーカイブをドラッグアンドドロップできるためです。オリジナルデータ増大の課題にアプローチできるのがLTFSの価値です。アクセスされていないデータは全体の80%と言われています。これらのデータをアーカイブデバイスに移し、オンラインストレージのシンプロビジョニング機能等を併用すれば、記憶媒体への投資の最適化ができます。今後は、計測データ・センサーデータ等IoT(Internet of Things)のデータが課題になります。

医療・監視システム・スマートグリッド・交通システム・音声・温湿度データなど様々な分野でオリジナルデータが増え、アーカイブが必要になります。これらのデータは今後削除されないで保存されると見ていますが、とてもではないですがシンプロビジョニングや重複排除のレベルでは解決できません。」(林氏)

今こそ来るべきビッグデータ時代に備えて、コールドデータの保存方法を再検討する時かもしれない。

テープ製品のスタンダード:LTO

LTFSは、LTO-5、LTO-6で使用できる。LTOとは、大容量保存を目指し、共通仕様として策定されたテープの規格である。今日では、デファクトスタンダードとして、LTO規格が使用されている。

明確な8世代のロードマップを持っており、現在の最新はLTO6で、1巻最大6.25TB(圧縮時)の保存が可能である。オートメーション製品を使用することで、複数のカートリッジに書き込むことができる。1UのHP 1/8 テープオートローダには8巻、最大50TBが保存できる。

日本HPでは最新規格LTO-6に対応したLTOドライブやLTOライブラリといった幅広いテープストレージ製品を提供しており、サーバーに内蔵できる単体ドライブ製品から、MSL6480のような、80スロットからスモールスタートができ、560スロットまで容量によって拡張ができるモデルまで、幅広いラインナップで、多様な環境に使用ができる。これらの製品は、小規模の環境・レガシーな環境だけではなく、映像業界等の大容量データの保存に採用されている。

図4 様々な環境に対応する幅広いラインナップ「HP StoreEver テープ ファミリー」

今だからこそ見直されるレガシーなメディアの技術革新

ハードディスクやSSDの低コスト化が進むなか、レガシーなメディアとして捉えられることの多いテープストレージも技術革新が進んでいる。企業が保有するアーカイブデータのうち、アクセスのほとんどないデータは8割にも上るとみられており、こうしたコールドデータの保存にはテープストレージが最もコストパフォーマンスに優れていると言えるだろう。「欧米ではSOX法などの法規制によるデータのリテンション期間の対策だけではなく、大容量保存のベストプラクティスとしてのテープ利用も広がりを見せています。日本でも、今後、大容量データの長期保存用途として、テープストレージの持つポテンシャルが再評価されることになるでしょう」(林氏)

データの"保存分け"が求められるビッグデータ時代には、ストレージシステムを賢く使い分けることがより重要になる。