Sun MicrosystemsのSchwartz CEOが、ハッキリと口にしてしまいました。そう、LeopardのファイルシステムにZFSが採用されることを。以前から確実視されていましたが、やはり立場のある方の発言はインパクトが違いますね。ホントかよ、とお疑いの向きはこちらで公開中のRealTimeムービーをチェックしてください。基調講演の開始後、約24分30秒(動画では27分30秒付近)あたりがその証拠です。

さて、今回はHDD監視ツール「S.M.A.R.T. Monitoring Tools」について。HDDを飛ばして大打撃を受けた過去を悔い、何より再発を防ぐために、スマートな予防方法を考えてみたい。

S.M.A.R.TにHDDの寿命を知る

S.M.A.R.T.(Self-Monitoring, Analysis And Reporting Technology)は、最近のHDDに搭載されている自己診断機能。温度やRead / Writeエラーなどの情報をHDDから取得し、物理障害による被害を未然に防ぐことが目的とされる。平たく言えば、HDDが"いつ頃逝くか"を予想するための機能だ。

そこで利用するのが「smartmontools」。HDDからS.M.A.R.T.情報を取得し、表示するためのツールだ。デーモンとして常駐させることも可能だが、コマンドとして都度実行すれば、その時点のHDDの状態を知ることができる。まずはこちらからパッケージを入手し、以下のとおり作業すること。なお、デフォルトの設定では、通常はコマンドサーチパスが通っていない/usr/local/sbinへインストールされることに注意してほしい。

$ tar xzf smartmontools-5.37.tar.gz
$ cd smartmontools-5.37
$ ./configure
$ make
$ sudo make install

インストール後は次のコマンドを実行し、メッセージに「SMART support is: Enabled」が含まれることを確認しよう。この場合、「-a」オプションを指定することで、起動ディスク(通常は/dev/disk0のはず)のS.M.A.R.T.情報すべてを表示している。問題なければ、オプションを「-t short」として、ショートテストを実行しておこう。

$ /usr/local/sbin/smartctl -a /dev/disk0

$ /usr/local/sbin/smartctl -t short /dev/disk0

記録されているエラー情報は、「-l error」とオプションを指定すれば知ることができる。「No Errors Logged」と表示されればとりあえず問題なし、当面は安心してHDDを使い続けられると考えていいだろう。ディスクにセクタエラーが「Error XX occurred ~」に続けて"寿命"が表示された場合には、エラーメッセージを読み解くことも大事だが、データのバックアップを最優先に処理すべきだ(自戒の念を込めて)。

$ /usr/local/sbin/smartctl -l error /dev/disk0

このように「No Errors Logged」と表示されれば、当面は懸念なし

ディスクにセクターエラーがある場合、このようにHDDの"寿命"が表示される

smartmontoolsには、ログをメールで通知するなどの便利な機能も用意されている。紙幅の都合により、今回は必要最低限の機能しか紹介できなかったが、また折を見て取り上げてみたい。

情報提供ありがとうございます

第227回で"悪徳データ復旧業者"の情報提供をお願いしたところ、早速KSさんから連絡をいただきました(ありがとうございます)。以下、ほぼ原文のまま紹介させていただきます。

1年半前にLinuxサーバーのHDDデータ復旧を某業者に依頼したことがありますが、HDD送付後の見積での「弱みにつけ込んだ営業トーク」を受けて泣く泣く支払に同意しました。

まず、どこが壊れたか、何の障害なのかを言わずに、

  • 「ラボ(業者の復旧処理室)ではイイ感じに回ってます」
  • 「検証段階ではデータは救い出せそうに感じます」
  • 「もしかしたらこの瞬間に止まってしまうかも知れない」
  • 「明日までの支払いに今同意すれば、このイイ感じを維持します」

などの発言が。急いでいたので頼みましたが、容量80GBのHDDで24万円ほど請求されました。

しかし後日、そのHDDはLVMパーティションマップとごく一部のデータのクラッシュだったことを自力で突き止めました。無知が故に高い勉強代を払ったもんだなと思いました(LinuxのLVMの復旧はその当時知らなかったので)。しかも別のHDDに移行されたデータの日本語ファイル名は文字化け(euc-jpだったのをs-jisのままコピー)、長いファイル名が途中で切れていたり、技術レベルは低かったと思います。高額で不当とは断言しませんが、急ぎで復旧したいという心情に訴えるのに十分な営業トークでしたね。

データの引っこ抜きほど悪質ではないにせよ、依頼人の足下を見ていることほぼ間違いなしという事例ですね。困っている人間の弱みにつけ込むなんて奴ぁ、コンピュータ野郎の風上にも置けねぇ……というわけで、啓蒙の意味を含め、また機会があれば悪徳業者の事例を紹介したいと思います。いやホント、HDDがこれほどまで一般化した現在、他人事じゃないと思うんですよね。