ワイ・イー・データはデータ復旧を提供している企業だが、同社では昨年辺りから、仮想化されたサーバの障害対応が増えているという。一般に、仮想化は耐障害性に有効と言われているが、いざ障害が発生すると、通常のサーバ環境よりも復旧に手がかかるおそれがあるそうだ。今回は、同社でR&D 技術員を務める吉川和弘氏と情報セキュリティ事業部事業部長を務める安尾浩氏に、仮想化サーバの障害対応の現状について話を聞いた。

ワイ・イー・データ オントラック事業部 R&D 技術員 吉川和宏氏

同社のデータ復旧を行うグループは、物理障害に対処するチームと論理障害を対処するチームに分かれている。この2チームによる障害対応の流れは次のような感じだ。

物理障害チームは、ハードディスクが破壊・クラッシュした場合にハードディスクが読めるように修復してディスクイメージを取り出す。論理障害チームは、そのディスクイメージのファイルシステムからファイルを取り出す。吉川氏はファイルの修復を行う論理障害チームの技術者だ。

今までに対応した仮想化されたサーバの障害対応について、大まかな状況を同氏より説明してもらった。

事例1 - RAIDのリビルド失敗でファイルシステムを破壊

1件目の企業では、ヴイエムウェアのサーバ向け仮想化サーバソフト「VMware ESX 」を用い、さらにRAID 6を組んでいた。顧客が障害対応としてRAIDのリビルドを行った際に誤ったアレイ構成でリビルドされてしまい、VMwareが動かなくなってしまったというのが、同社にデータ復旧が持ち込まれた要因だ。

10台のハードディスクに、仮想マシン6台が作成され、そこにWindowsとLinuxが混在するという環境だった。「10台のドライブからデータを取り出してファイルを修復しなければならなかったのですが、リビルドに失敗していたので、ファイルシステムが異常なデータで上書きされており、非常に大変でした」と同氏。

RAID 6はハードディスクが2台同時に故障してもデータが失われないが、逆に言うと、3台以上同時に故障したらデータは消失してしまう。同氏は、「RAIDシステムは一般的に大容量のものが多く、バックアップを取得するのが大変なのと、その"安全神話"を信じて安心してしまって、バックアップを取らない企業が多いのですが、実に危険です」と指摘する。この顧客もバックアップを取っていなかったそうだ。

事例2 - フォーマットで重要なハードディスク情報を消失

2件目の企業では、ヴイエムウェアのフリーのサーバ向け仮想化ソフト「VMware ESXi 」が用いられていた。こちらでもRAIDが利用されていたが、RAIDの問題はなかったという。この企業の場合、システムの再インストールを行った際にハードディスクを誤ってフォーマットしてしまったというのが障害の原因だ。

ファイルの復旧の具体的な手法は後述するが、同氏は「ファイルシステムをフォーマットもしくは削除してしまうと、ファイルの復旧に必要なハードディスクの情報が消えてしまい、復旧作業が困難になる」と説明する。

この企業は5TBの容量のうち仮想サーバに600GBを利用しており、さらにデータ部分は100GBで、このデータの復旧に要した期間は8日間だった。「フォーマットしたために、ハードディスクの情報が書き込まれている"MAP情報"が失われてしまい、ファイルを繋ぎ合わせるのに苦労しました」

事例3 - イメージファイル拡張時に障害発生

3件目の企業では、ヴイエムウェアのデスクトップ仮想化ソフトウェア「VMware Workstation 」を用いて、仮想化環境を構築していた。この企業では、仮想マシンのイメージファイルの容量を拡張しようとしたところ障害が発生し、0バイト、つまり削除されてしまったため、それを復旧してもらいたいというのが依頼内容だった。

1台のハードディスクに複数の仮想マシンが構築されているという環境だったが、壊れたのは1台の仮想マシンだったという。作業時間はおよそ1週間だった。