1個のHDDが壊れると全仮想マシンが壊れるのが仮想環境

仮想化は運用の負荷とコストの低減に有用な策として、企業での採用が増えているが、データ復旧という観点から見るとどうなのだろうか? 実は、HDD障害の可能性や障害発生時のデータ復旧という面では注意が必要だという。特に問題となるのは、現在のトレンドであるサーバ統合を目的とした仮想化技術の利用である。

「サーバ統合では、1台のハードウェアに複数の仮想マシンを格納します。つまり、1台のHDDが壊れたら、その影響が格納されているすべての仮想マシンに及んでしまうのです」と、ワイ・イーデータ 情報セキュリティ事業部 R&D 技術員の吉川和宏氏は語る。

複数のサーバを1台に集約すればスペースや消費電力を減らすことができ、管理負荷も抑えられる。また、ハードウェアの性能を十分に使い切ることで、無駄もなくなる。しかし仮想環境では、そうしたメリットとともに、1つのトラブルが全体に影響するというリスクがあることを理解しておかなければならないのだ。

仮想環境も通常の環境と同様、トラブルの種類は物理障害と論理障害に分けられる。仮想環境特有の障害が出やすいのは論理障害だ。人為的なミスによってボリュームや仮想マシンを削除してしまったというケースも少なくないという。最近は仮想環境を構築する際の設定が簡略化されているため、チェックのつけ間違えやボタンの押し間違えといった些細なミスで取り返しのつかないトラブルが発生することもある。

「論理障害の多くは"ミスやトラブルで管理情報が失われた結果、データにアクセスできなくなる"というものです。物理障害は普通のPCと障害内容も発生率も同じです。ただ、1台のHDDが壊れた時の影響は甚大ですから、コストダウンを目的に中小企業が安価なPCサーバと無料の仮想化技術を利用していると聞くと、心配になりますね」と同氏。クラウドサービスなどを利用する時も、データの保持がどこまで保証されているかについてしっかり確認するべきという指摘がされた。

"複雑なパズル解き"のヒントになる設定の記録は必須

HDDへのデータ記録は連続的に行われない。したがって、データを読み出す際は、管理情報に従ってHDD上の隙間を見つけてバラバラに書き込まれたデータの断片を拾い集めているというわけだ。1つのハードウェアに複数の仮想マシンが構築されている場合、仮想マシンごとですらデータが分かれていないことが問題となる。この場合、仮想マシンAのデータの切れ端の次に仮想マシンBのデータの切れ端があるなど、完全に混ざった形でデータが記録されている。

「データの管理情報が失われた場合、人間が残されたデータをパズルのようにつなぎ合わせます。1つのOSのデータをつなぎ合わせる作業は、慣れた技術者ならばそれほど難しくありません。しかし、仮想環境では同一のOSが複数入っていることがあるため、データがどの仮想マシンの断片かを判断することが非常に難しいのです」と、同氏は現場の苦労を語る。たとえるならば、似たような風景画の複数のパズルを混ぜ合わせて与えられているような状況だという。HDDが1台ではなく、複数台にわたっている場合やRAID環境となれば、さらに事態は複雑化する。

仮想HDDのデータ格納情報はMAP情報に記録されているが、フォーマットや削除を行うとMAP情報が消滅して、ファイルのつながりがわからなくなる

同社では通常、一般的なPCのHDDならば数営業日で処理を完了できる。しかし仮想環境の障害復旧には最低でも1~2週間が必要だという。難しい案件であれば、1ヵ月ほど必要になることもある。しかも、それだけの期間をかければすべてのデータが取り出せるというわけではないようだ。

「仮想環境の復旧作業においては、お客様にどうしても取り出したいデータを指定していただくようにしています。なぜなら、われわれの仕事には時間の制限があるからです。お客様は少しでも早くデータが復旧されることを望んでいます。"どの仮想マシンのどのデータ"といったように、指定されたデータを探し出すことにまずは注力します。」と同氏。

「いくらでも時間をかけてよいから全部のデータを取り出してくれ」という依頼ならば技術的に対応可能なこともあるが、この場合、所要時間は数ヵ月~年単位へと跳ね上がって費用も相応にかかってしまうため、現実的ではない。

目的のデータを拾い出せるかどうかは、各仮想マシンの設定やボリュームの割り振り方などの管理情報がきちんと記録されているかどうかにかかっている。こうした記録を示すことは、ジグソーパズルの完成予想図を見せるのと同じくらいの効果がある。何の手がかりもなく手探りでの作業は難しすぎる。

「中小企業などで、ITに詳しい人が実験的に仮想環境を構築した結果、ビジネスにも使えそうだからとそのまま使い続けてしまっているような場合は注意が必要です。初期設定が記録されていなかったり、担当者がいないので何もわからなかったりというケースがあります。トラブル発生時にすぐ出せるように、設定情報がドキュメントにまとめてあるとよいですね」と吉川氏はアドバイスする。

VMware環境での仮想HDD利用方式は「固定容量」でなければダメ!

また仮想環境は、構築時の初期設定次第で復旧の可能性がほぼなくなってしまうこともあるという。仮想HDDの設定には、最初から最大容量の仮想HDDを作成し、各仮想マシンに割り振って使う「容量固定方式」と、最初には最大容量を確保せずに、実際に使用した容量だけ自動的に拡張されていく「可変ディスク方式」がある。

当然、可変ディスク方式のほうがスタート時に用意しなければならないHDD容量が少ない分、低コストで始められる。将来的な成長に柔軟に対応できることもあり、こちらを選択する企業も多い。しかし、同氏は固定容量での設定を強く推奨している。

「VMwareでは固定容量方式をシック フォーマットと言うのですが、こちらが公式にも推奨されています。アクセス速度も速いですし、何より仮想HDDの断片化が少なく万が一の場合もデータ復旧の可能性が十分にあります。可変ディスク方式をシン フォーマットと呼びますが、こちらはほぼ復旧できないと思っていただかないとなりません」

さらに同氏は、「データ復旧事業者でも、仮想環境のデータ復旧のノウハウは持っているところが少ない状況です。そうしたなか、当社は仮想環境のデータ復旧に関するノウハウをかなり持っていますが、それでもシン フォーマットで設定されたものを復旧できたことはありません。万が一を考えるならば設定はシック フォーマット。これは絶対です」と強調する。

重要なデータは別途バックアップ

固定容量の設定を行い、各種設定の記録をきちんとしておくほかに気をつけるべきこととして挙げられたのは、定期的なバックアップだ。いかなるシステムを使う際もバックアップは重要だが、仮想環境では特に割り切ったバックアップが重要だという。

同氏は、「システム全体をバックアップしようとすると、容量が多いため時間も膨大にかかります。昔のように夜間バックアップで済めばよいのですが、最近は終わらないことも多いでしょう。だからといって、バックアップの頻度が減るのは問題です。重要なデータだけは別途バックアップしてください」と語る。

データを復旧しなければならない事態に陥った時、誰でも「あわよくばまるごと復旧してもらいたい」と考える。しかし、それが難しいとなれば「どうしてもこれだけは欲しい」というデータが出てくる。その「どうしても欲しいデータ」がきちんとバックアップできていれば、時間とコストをかけてデータ復旧にチャレンジする必要もなくなるのだ。仮想環境を導入する時は、1つのハードウェアが損傷したら複数の仮想マシンに影響が出るということを理解するとともに、データが損なわれる可能性を踏まえた対策を事前に行いつつ、万全のバックアップ体制を整えるべきなのだ。