。日本には長期休暇が終わると、出社初日の午前9時に一斉にログインしてトラフィックの急増を招く特徴があるという。
SASE(Secure Access Service Edge)プラットフォームを提供する「Cato Networks」は5月19日(現地時間)、「How We Mastered Japan’s Golden Week Traffic Spike| Cato Networks」において、日本特有のネットワークの課題とそれをどのようにして克服したかについて伝えた。
日本はゴールデンウィークなどの長期休暇を終えると、出社初日の午前9時に一斉にログインしてトラフィックの急増を招く特徴があるという。同社は毎年発生するこの急激なトラフィック上昇を試練と捉え、いかにして克服および完璧なエクスペリエンスを提供したか、エンジニアリングと運用の視点からその舞台裏を紹介した。
日本のゴールデンウィークの特殊性
Cato Networksによると日本のゴールデンウィークは他国と比べ同期性の高さに特徴があるという。米国では休暇およびその後の復帰タイミングがタイムゾーンや州ごとに分散する傾向にある。これに対し日本は全国で一斉に休みに入り、一斉に復帰する傾向が高く、特に都市圏では需要の急増がみられるとのこと。
ネットワークはトラフィックの急増が課題となる。能力の限界に近づくと輻輳が発生し、本来の能力すら発揮することができなくなり、通信障害に至ることがある。そのため、ピークをいかに抑えるかが重要とされるが、日本の場合は休み明けにトラフィックが急増する。
同社の調査によると、この影響は業務再開後の最初の30分に集中し、トラフィックは通常時ピークの2.5倍以上に増加するという。原因はログインによるトラフィックに加え、デバイス全体の同期操作、ソフトウェアアップデート、コラボレーションプラットフォームの更新にあると指摘している。
ピーク負荷と回復力を考慮したプラットフォームの設計
Cato Networksは毎年繰り返される日本の急激なトラフィック増加を予測し、この特殊な負荷に対応できるよう特別な準備をしたという。その具体的な対策は次のとおり。
拠点の拡張と冗長性
需要の急増に応えるため、基本的な対策として、同社はハード面における次の対策を実施。
- 日本国内の地理的な分散と回復力を高めるため、新しい拠点(PoP: Point of Presence)を追加。さらに既存のルータをアップグレードし、物理的なスループットを大幅に向上した
- 負荷がかかった状態で増加する東西トラフィック(東京、大阪間)をサポートするため、PoP内のデータバスを拡張し、顧客向けサービスをコア処理コンポーネントにリンクした
- パケット検査、トンネリング、暗号化などに必要な計算能力向上のためにCPUコアを増強した
監視機能を活用したパフォーマンスの調整
ハード面における事前準備を終えた同社は、本番当日の午前9時から10時まで十分な人員を配置し、次の対応を実施することで難局を乗り切ったという。
- 各PoPにおけるトラフィック、VPNトンネル数、トンネルスループットをリアルタイムに監視
- ポート使用率、パケットドロップ率、コンポーネント間の同期障害の可視性を確保
- PoPごとにカスタムダッシュボードを作成。業務再開後の最初の1時間、健全性とパフォーマンスの両方を追跡して調整
これら対応により同社は過去最高の記録となった今年のトラフィック急増に耐え、一貫したパフォーマンスの提供に成功した。ピーク時におけるVPNトンネル数とスループットは前年比2倍以上だったが、レイテンシー(遅延時間)の急上昇を抑え、パケットドロップ率もごくわずかに抑えたという。
企業や組織はオンプレミス環境からクラウドソリューションへの移行を推進し、さらにコラボレーションによる業務の効率化、高度化を進めている。今後もこの傾向は続くとみられており、クラウドを中心としたインフラストラクチャーの重要性が高まっている。
ネットワークはピーク需要を乗り切ることが重要となる。急激なトラフィックの上昇により通信障害に悩まされている企業には、これら対策を参考にハード面、ソフト面の双方からシステムを見直すことが望まれている。