NTTドコモは12月21日、前日発生したスマートフォンでの障害について記者会見を開催。同社 辻村清行副社長が障害の原因について説明し、ユーザーに謝罪した。
今回の障害は、ドコモスマートフォンが利用するインターネット接続サービス「spモード」で発生し、ユーザーがメールを送信すると他人のメールアドレスに書き換えられ、そのまま返信すると、そのメールアドレスを使う他人にメールが送信されてしまうといったもの。この障害の理由についてドコモは、spモードのネットワークにおけるユーザー管理サーバーの障害によるものと説明している。
障害は、12月20日12時22分に発生。関西地域で、普段は常時接続状態のスマートフォンがネットワークから切断され、再接続が一斉に行われた。ドコモでは関西地域のネットワークで保守作業を行っている際に、作業員が中継伝送路の光ファイバに接触し、それによって通信が断絶したことが大本の原因だと推測している。
ドコモのネットワークでは、端末からの要求によってパケット交換機経由で、ネットワーク認証サーバーがユーザー管理サーバーに問い合わせて認証を行う。認証されると、パケット交換機は特定のIPアドレス範囲から端末に対してIPアドレスを払い出し、端末と認証サーバーに通知を行う。その通知はネットワーク認証サーバーからセッション管理サーバーに伝えられ、さらにユーザー管理サーバーの情報に基づき、IPアドレスと端末の電話番号の関連付けが行われる。
今回の例では、障害が発生して通信が途絶したとき、パケット交換機が一斉に端末のIPアドレスの解放を要求。その要求に対してユーザー管理サーバーが通信集中によって輻輳(ふくそう)を起こし、セッション管理サーバーからの問い合わせに応答しなくなった。このとき、セッション管理サーバーはそれまでのIPアドレスと電話番号の関連付けを保持したままの状態だった。その状態で、IPアドレスが解放された端末は再び認証を要求。セッション管理サーバーに改めて電話番号が登録され、ネットワーク認証サーバーからの応答に従ってパケット交換機が新たなIPアドレスを払い出し、端末とネットワーク認証サーバーにそれぞれ通知。このIPアドレスは、セッション管理サーバー経由でユーザー管理サーバーに通知されるが、輻輳によって応答がないため、セッション管理サーバーは保持した関連付けのままとなってしまった。この時、新たに払い出されたIPアドレスが、もともと他人に払い出されていたものだった場合、端末上に割り当てられたIPアドレスと電話番号の組み合わせと、セッション管理サーバーが登録しているIPアドレスと電話番号の組み合わせが"アンマッチ状態"になってしまった。
この結果、例えばspモードメールを使っているアンマッチ状態に陥った「Aさん」が「Bさん」にメールを送信すると、セッション管理サーバーがAさんのIPアドレスを、他人の「Cさん」のIPアドレスと認識。メール送信元がAさんではなくCさんであると判断して、メールの送信者欄(From:ヘッダ)をCさんのアドレスに書き換えてBさんに送信する状態になる。この状態で気付かずにBさんが返信をすると、AさんではなくCさんにメールが届く(AさんとCさんがspモードを使用し、アンマッチ状態になっていることが条件。Bさん自体の利用するメールシステムの種類は問わない)。Bさんからのメールが他人のCさんに届いてしまうことで、メールアドレスや本文の情報が漏えいしてしまい、Aさんに対してはBさんのメールが届かない、という事象が発生するかたちになってしまった。
ドコモの説明では、障害発生後、通信規制を行うことでユーザー管理サーバーでの輻輳を解消(14時25分ごろ)。ユーザーからの問い合わせで14~15時にはメールアドレスが書き換わる問題を把握した。パケット交換機をリセットしてアンマッチ状態の解消に乗り出したのが「夕方ぐらい」(辻村清行副社長)だという。アンマッチ状態は関西地域を中心に18時ごろまで続き、ログを調査したところ、最大10万人がアンマッチ状態になっていたという。ただし、主に12時から14時までの2時間程度の間、spモードメールを使ったユーザー(とその送信相手)のみが影響を受けるため、問い合わせ数は108件(12月21日午前7時30分現在)にとどまっている。
ドコモでは、今後ログを精査するなどして、実際にどこまで不具合が影響したのかを検証していく。現在は、検証のためにspモードにまつわる21件のサービスを停止している。それ以外のサービスは現在通常通り利用可能だ。なお、現時点でまだ不具合が発生している場合は、端末を再起動することで問題を解消できると説明している(新たなIPアドレスが割り当てられるため)。
なお、今回の障害とは別に今年8月にもトラフィック増によるspモードの障害が発生しており、ドコモはネットワークの増強を図っていた。今回の障害は8月の障害とは異なるユーザー管理サーバーに障害が発生し、さらにテストよりも少ないトラフィックにもかかわらず輻輳を起こしたとのことだ。
辻村副社長は今回の障害について、スマートフォンの急増が背景にあると指摘。スマートフォンによるこれまでにないトラフィックがコアネットワークや今回のようなサーバー系でも増大すると説明。「これまでも十分気をつけていたが、うまくいかなかった」と述べた。これに対し、ユーザー管理サーバーを最適化し、IPアドレスの通知などでのプロトコルの改善を行うほか、「ほかの所でもネックがないか、(山田隆持)社長をリーダーにしたプロジェクトチームを作って再点検する」(辻村副社長)考えだ。
(提供:AndroWire編集部)
関連記事
・スマートフォン向けISP「spモード」に大規模な通信障害 - NTTドコモ (2011年08月16日)