前回紹介した「メモリリークによる機器機能停止」と同様に、システム管理者がしばしば遭遇するのが「機器のバグによる機器機能停止」です。メモリリークがアプリケーションなどのソフトウェアのバグによって引き起こされるシステム障害だとすると、機器のバグによる機器機能停止は、ハードウェア上に実装されたファームウェアのバグが原因になることが多いシステム障害です。

機器のバグは、ソフトウェアのバグに比べてトラブルの原因やアッブデートによる改修が難しい面があります。ソフトウェアのバグは、ソフトウェアがOSSとして提供されていたり、ベンダー側がリソースを多く割く傾向があるため、改修が比較的スムーズに進むと言えます。コミュニティの情報をもとに自身でソースコードを修正したり、機器をサポートするパートナーが独自のパッチを提供してくれたりもします。

一方、機器のバグは、メーカーやベンダーが独自に開発しているファームウェアを改修する必要があります。バグが修正されるかどうかはベンダー側の対応に依存していて、海外ベンダーの場合はやりとりにかなり時間がかかります。また、修正されたとのアナウンスを受けた場合でも、自社環境だけで再発するといったケースがあります。そのときは再び報告を行ってベンダー側の対応を待つことになります。対応を待つ間に機器のリプレース期間を迎えてしまったという冗談のような事態もよく起こります。

最大の問題は、機器やファームウェアのどこにバグが潜んでいるか、ユーザーの立場ではまったくといっていいほどわからないことでしょう。バグの特定は高度なスキルやノウハウを持ったエンジニアでも難しいとされます。実際、スキルを持った保守サポート事業者でも、機器のバグでトラブルが発生した場合には、問題の特定を行わず機器をそっくり新しいものを入れ替えるという対応を行うことが多いそうです。

バグの原因特定とプログラムの修正が難しいとなると、ユーザーには何ができるでしょうか。機器メーカーのA社がとった対応は、原因の早期発見と、トラブルへの早期対応でした。具体的には、機器を含めてシステムを統合的に監視できるシステムを構築し、障害が起こったときには緊急対応策で乗り切ることができるようにしました。こうした体制を築くためにカギになったのは、海外ベンダーの機器を数多く取り扱い、ベンダーとの強いパイプも持っているパートナーだったとのことです。

機器のバグによる機器機能停止に対して、ユーザー側でできることは限られます。外部のパートナーをうまく活用し、危機を乗り切りたいところです。

監修:シーティーシー・テクノロジー

シーティーシー・テクノロジーは、伊藤忠テクノソリューションズ(CTC)グループで、ITシステムの保守サポート、運用サービス、教育事業を提供する企業。1972年に創業し、全国に保守拠点を持つ。サポートする機器は契約台数約30万台に及び、年間約6万7,000件の障害対応を行うなど、トラブルシューティングのスペシャリスト集団である。

シーティーシー・テクノロジーのHPはこちら
同社が提供するトラブルシューティングサービス「Avail-ProE」の詳細はこちら

[PR]提供:シーティーシー・テクノロジー