2022年7月2日より86時間にわたって発生したKDDIの通信障害は、その影響が多岐にわたり社会的影響が非常に大きなものとなりました。→過去の回はこちらを参照。

モバイル通信の利用がより広がりを見せるであろう5G、そして6G時代に向けては通信障害が与える影響がより大きなものになってくると考えられますが、一方で障害発生時の復旧を自動化する取り組みも進められつつあるようです。

機器の増加や複雑化で輻輳が発生しやすい環境に

KDDIが2022年7月2日に発生させた通信障害は、その後3日以上にわたって影響が続く非常に大規模なものとなり、主として音声通話に影響が出たことから、緊急通報ができなくなるなど非常に深刻な影響をもたらすこととなりました。

【関連記事】
≪NTTドコモの通信障害が示す、5G・IoTがもたらす小さくないネットワークへの影響≫
≪携帯大手3社の5Gエリア整備状況と2022年の戦略を追う≫

それに加えて、同社の回線を利用していたATMや気象観測所などが使えなくなるなど、その影響は携帯電話やスマートフォン以外の部分にも及んだことでも注目されました。

  • 次世代移動通信システム「5G」とは 第73回

    KDDIは2022年7月2日から86時間にわたって通信障害を発生させ、その影響が多岐にわたったことから翌7月3日に同社は説明会を実施、謝罪するに至っている

通信障害の原因がまだ完全に判明している訳ではありませんが、これまでの経緯を振り返りますと、そのきっかけは同社のコアネットワーク内にあるルータを交換するという、通常のメンテナンス作業にあったようです。

KDDIではルータ交換のため音声通話のトラフィックルートを変更したのですが、その際なぜか一部の音声通話が15分不通になってしまったとのこと。

そこでルートを元に戻したところ、その間にスマートフォンなどから定期的に実施されていたアクセスが殺到。4Gでの音声通話を処理するVoLTE交換機が輻輳(ふくそう)状態を招き、それがネットワークの他の場所にも広がったことで大規模障害へとつながったようです。

  • 次世代移動通信システム「5G」とは 第73回

    KDDIの通信障害はコアネットワーク内のルータを交換するというメンテナンス作業の際、音声トラフィックのルートを変えたところ音声通話が一時不通となり、それが大規模障害の発端となっている

輻輳による大規模障害と聞くと思い起こされるのが、2021年10月にNTTドコモが起こした通信障害ではないでしょうか。

この時はIoT向けのネットワークで機器を交換する際、やはり不具合が生じて元の機器に戻し、IoT端末の位置情報を加入者データベースに登録し直そうとしたところ、その数が20万にも上ったため処理が間に合わず輻輳が発生。それが他の場所の輻輳を生み大規模障害へとつながっています。

  • 次世代移動通信システム「5G」とは 第73回

    2021年10月に発生したNTTドコモの通信障害も、メンテナンス中に不具合が生じ切り戻しをしたところ、IoT端末から大量の位置登録を発生させ、輻輳が生じ大規模障害に至っている

現在は、多数のIoT機器がネットワークに接続するようになっただけでなく、携帯電話からより高度な機能を実現するスマートフォンに進化したことで、その高い機能を実現するためネットワークにアクセスする頻度が増えています。

それゆえ、一連の障害事例を見ますと、日ごろからネットワークにかかる負荷が大きいことから、メンテナンス作業中のちょっとしたトラブルで輻輳が起きやすくなっており、大規模障害に発展しやすい様子を見て取ることができます。

そうした傾向は5Gの利用が本格化し、企業でのモバイル通信利用が加速したり、デバイスの高度化が進んだりすることで一層加速するものと考えられます。

そのため今後、輻輳による大規模通信障害はより発生しやすくなると考えられますし、1社だけの対応では障害発生時の社会的影響に対処するのは困難なことから、携帯電話会社間でのローミングや緊急通報手段の確保など、社会全体で影響を抑える枠組み作りが求められることは確かです。

実は加速している通信障害からの復旧作業の自動化

ただ一方で、携帯電話会社もそうした障害が起きやすい時代に向けて対応を進めていない訳ではありません。例えば、NTTドコモの通信障害を受け、一般ユーザー向けとIoT向けのネットワークを切り離して影響を抑える措置が取られるようになりました。

今回のKDDIの通信障害においても、IoT向け通信はネットワークが分けられていたことから、影響は1500万回線のうち最大で150万回線と10分の1にとどまっていますし、その多くは音声通話の仕組みを用いるSMSを活用していたものに限られるようです。

そして、より大きな動きとなっているのが、ネットワーク障害の検知や復旧をはじめとした保守運用業務の自動化です。ネットワークの進化に伴い保守運用業務も複雑化し、手作業での対処には限界がきていることから、携帯各社はそれらを自動化する取り組みに力を入れているのです。

実際、楽天モバイルは完全仮想化により多くの部分をソフトで対処できるというネットワークの特性を生かして保守運用の自動化に力を入れていますし、NTTドコモも「ゼロタッチオペレーション構想」を打ち出し、自動化に向けた取り組みを進めています。

  • 次世代移動通信システム「5G」とは 第73回

    NTTドコモは「ゼロタッチオペレーション構想」を打ち出し、障害への対処などネットワークの保守運用業務を可能な限り自動化する取り組みを進めている

KDDIも同じく、保守運用業務の自動化を積極的に推し進めており、東京都多摩市に新たに設けられたネットワーク運用拠点では、災害や障害が発生した際、従来は人手によって実施されてきた復旧作業などを自動化し、早期復旧につなげる取り組みを進めてきました。

  • 次世代移動通信システム「5G」とは 第73回

    KDDIは東京都多摩市の新しいネットワーク運用拠点において、従来人の手に頼っていた障害からの復旧対応などの作業を洗い出し、自動化するスマートオペレーションを導入している

加えて、KDDIは2021年1月より、総務省の研究の一環として日立製作所や沖電気工業などと「AIネットワーク統合基盤」を活用した5Gネットワーク障害時の自動復旧システムの有効性を確認する実証実験を実施。

AIが通信障害を検知し、自動的にネットワークを再構築してネットワークの再構築を図る検証を進めています。ただ今回の障害は、それら同社の自動化に向けた取り組みがまだ進んでいない部分で発生したものだったため、自動復旧の実現には至らなかったようです。

しかし、今回の障害とその反省を受けて、同社は今後より多くの部分の輻輳に対応できるよう自動化システムを強化していくことが考えられます。

ちなみに、日本でのBeyond 5G、6Gに向けた取り組みを推し進める「Beyond 5G推進コンソーシアム」が打ち出す、Beyond 5Gで求められる機能の中には、災害や障害から瞬時に復旧する「超安全・信頼性」が含まれています。

通信障害からの自動復旧は今後のネットワークの必須条件となる可能性が高いといえます。それゆえ今後6Gの標準化に向けては、ネットワーク性能の高度化だけでなく、通信障害を未然に防ぐ技術の確立にも注目が集まるところです。

  • 次世代移動通信システム「5G」とは 第73回

    「Beyond 5G推進コンソーシアム」が掲げる、Beyond 5Gで求められる機能の中には「災害や障害からの瞬時復旧」という項目が盛り込まれている