ここ数年、サーバ仮想化の普及が進んでいます。しかし、その利便性ばかりに注目が集まっていて、障害対応などの"負の側面"に関する啓蒙が不足しているように思います。サーバ仮想化の環境に障害が発生してデータを復旧しなければならなくなったら、どのような手順で作業を行わなければならないのか……サーバの仮想化を行っている方々はここまで考えておられるでしょうか? データ復旧を生業としている筆者の視点から、サーバ仮想化についてお話したいと思います。

サーバ仮想化ってどんなもの?

一般に、サーバ仮想化とは、「増加を続けるコンピュータ・リソースを整理統合して、電力消費を含めたITコストの節約」の方策として期待されているようです。実際のところはどうなのでしょうか? 以下、できるだけ単純明快に、サーバ仮想化についてまとめてみました。

  1. 専用のOS(ホストOS)で動作している1台の物理サーバ上で、複数の(別のOS<ゲストOS>で動作している)論理サーバを動作させる。ハードディスクで言えば、1台のドライブ(物理ドライブ:ホスト)をパーティーションで分割して複数のドライブ(論理ドライブ:ゲスト)として使うようなもの。   
  2. 古くてサポート期間が終了して利用できるハードウェアが存在しないようなOSにも、ホストが仲介してくれるので、安心して最新のハードウェア上で使うことができる。例えば、「Windows Vistaが重たいので最新のパソコンでWindows 98を使いたい。でも、最新のチップセットをサポートしていないし、最新のプリンターなどもドライバーがないから使えない」といった場合でも、仮想化によりホストOSを仲介させることで使えるようにしてしまうことが可能だ(昔の遺産を引き続き使用しなければならないシステム管理者にとっては夢のような話)。

  3. 小規模な環境でも構築できる。実際、シングルHDDのサーバにVMwareを入れて何種類ものOSをインストールしていた環境が故障したので、「データ復旧してくれ」なんていう依頼を受け付けたこともあります(データ復旧の作業は結構厄介でしたが……)。つまり、サーバ仮想化は大規模なサーバだけが対象になっている大層なものではなく、もっと身近で便利なものなのです。

物理サーバがこけたらすべてパー!?

データ復旧を生業とする筆者から見ると、仮想化環境とは複数のサーバが1台の物理サーバ上で動いている状態なわけで、「怖いので使いたくない」というのが本音です。だって、古い言い方ですが、「親亀の背中に小亀を乗せているところ、親亀こけたら皆こけた!」ですよ。

今までに当社でデータ復旧依頼を受けた仮想化サーバの障害内容は、ほとんどが「ホストOSの取り扱いを間違えたヒューマンエラー」や、ハードウェアに異常のない「ホストOSの論理障害」です。これは日本だけに限らず、世界共通の話です。

実のところ、当社が提供している「データ復旧サービス」で取り扱うHDD障害の80%以上において、HDDが故障している「物理障害」であるにもかかわらず、仮想化サーバの障害では、なぜか論理障害の比率が異常に高いのです。 これは、仮想化に慣れた管理者がまだ少ないことの証明かもしれません。それだけに、サーバ仮想化環境では、バックアップなどのデータ保全体制をこれまで以上に厳重に運用すること必要があると思います。

もし、ディザスタリカバリ(遠隔地ミラーリングなどでデータの保全を図る)並みの厳重な体制をとった上であれば、サーバ仮想化の利点は十分に発揮され、サーバ仮想化に対するデータ復旧屋から見た恐怖も解消されると思います。

システム管理者のスキルが障害防止のカギ

最も多いサーバ仮想化の障害要因がヒューマンエラーである以上、管理者には予防策をしっかりと学んでもらうしかないのですが、仮想化の導入がかなり進んでいる米国でもシステム管理者のスキル不足が最大の懸念材料になっているそうです。

データを復旧する上で大切なのは、そのサーバ全体の構成情報です。具体的には、「サーバ全体をどのように"小亀サーバ"に割り振っているのか」、「"小亀サーバ"のOSのフォーマット形式は何なのか」などなど。これらは当たり前ですが、壊れてしまうとすべての"小亀サーバ"が全滅してしまいます。

そして、これをどう読み解くかがデータ復旧の可否にかかってきます。その壊れ方としては、デジカメ用のメモリーカードで「フォーマットしますか」の警告が出る場合と同レベルの場合が多いです。

データを失わないための三ヵ条

では、データの喪失を最小限にとどめるためのポイントを3つ紹介しましょう。

  • (1)厳重なバックアップ体制の構築
    →当たり前ですが・・・全ての小亀を対象に!

  • (2)システムメンテの手抜きをしない
    以下のようなケースはよくあります。

RAID5は堅牢だから、バックアップはしていません
→1台のハードディスクにアラートが出ていますが、すぐ止められないので連休になったら交換して再構築します
→2台目に障害が起きて大騒ぎ……

 当社の技術者が執筆したコラムの【サーバと温度】をご覧下さい。

  • (3)「小亀サーバ」の容量を後から変更しない
    容量を後から変更すると、そのサーバ領域自体が断片化します。ですから、その上に存在するファイルの断片化はさらに激しくなる可能性が出てきますし、正しいサーバの領域を見つけ出すことが難しくなります(障害が起きることを前提にしての話です。万が一の場合、データの消失の可能性を少しでも抑えるためにお願いします)

さて、データ復旧屋の視点から、サーバ仮想化について書き連ねましたが、サーバ仮想化は、データセンターやレンタルサーバ事業のように管理が十分に行き届いた環境の下であれば、非常に有用なものであることは間違いないと思っています。

ソフトウェアは、ハードウェアに何ら障害がないことを前提として作られており、その前提が満たされることで本来の性能・役割を発揮できます。ソフトウェアのメリットが得られるかどうかは利用者側の問題と言ってしまえばそれまでですが、そのための警鐘として受け取っていただければ幸いです。

ワイ・イー・データ オントラック事業部

1994年末、データ復旧サービスの世界最大手である米オントラック社と独占的技術導入契約を締結し、ストレージ機器の製造・開発技術・経験・設備を活かしたデータ復旧サービス事業に進出。1995年、国内で最初のデータ復旧専用ラボを埼玉県入間市に開設し、国内及びアジア地区の拠点として、デジタルカメラ用メモリーカードからHDD、大規模サーバ、NAS等データなどの復旧サービスを提供している。業界で唯一の東証上場会社でもある。

参照:ワイ・イー・データ データ復旧サービス