ThousandEyesは8月19日、公式ブログ「Google Outage Analysis: August 9, 2022」において、2022年8月9日にGoogleで発生したサービス障害に関する分析結果を公開した。分析は、ThousandEyesが世界中に配置している監視ポイントにおける観測結果をもとに行われたもので、障害の規模や時間軸での影響の広がり方などがまとめられている。

Googleサービスの障害は、UTC(協定世界時)で2022年8月9日の10時15分(日本時間で同10時15分)頃から始まり、約1時間にわたって続いた。その間、Google検索やGoogleマップをはじめとするGoogleサービスが読み込めなくなるか、読み込めても正常に動作しない状態に陥った。

ThousandEyesの観測では、この日の障害は世界中の多くの場所に影響を及ぼしたことが確認できたという。サービスの停止は当初、アジアやヨーロッパなどの複数の場所で確認され、その後わずか数分で世界中に波及し、UTC 1時半頃から1時45分頃にかけてピークを迎えた。その後一旦収束したように見えるが、UTC 2時頃に2回目の短い停止が発生している。

  • 2022年8月9日に発生したGoogleサービス停止のタイムライン(引用:ThousandEyes Blog)

    2022年8月9日に発生したGoogleサービス停止のタイムライン 引用:ThousandEyes Blog

ThousandEyesの監視ポイントにおけるネットワークレイヤーのメトリックを確認したところ、この障害の発生中にGoogleサービスに対するWeb接続試行の失敗数が増加しているが、Googleサーバへのパスでのパケット損失は確認されなかったという。このことは、障害がアプリケーション層で発生した問題によるものである可能性を示している。その代わりに、Google WebサーバーからはHTTP 500または502のステータスコードが返答されたという。これは、問題の原因がサーバ側の内部エラーであることを示す。

  • 世界各地におけるピーク時の障害の影響(引用:ThousandEyes Blog)

    世界各地におけるピーク時の障害の影響 引用:ThousandEyes Blog

Googleは、同日に発生した障害がソフトウェアアップデートの失敗によるものだと説明している。

ThousandEyesのレポートでは、Google検索のような安定したサービスであっても問題が発生する可能性がある点、人々が日常的に利用しているデジタルサービスの多くが一部のソフトウェアシステムに依存している点を強調している。そして、優れたユーザエクスペリエンスを確保するには、これらバックエンドのアプリケーションの依存関係を監視し、そのパフォーマンスを測定することが必要だと指摘している。