クラウド移行の価値を説明できないあなたへ - 期待と現実のギャップを埋める戦略 - いまさら聞けないオブザーバビリティ(4)

近年、コスト削減とビジネスアジリティ向上への期待から、自社のシステムをオンプレミス環境からクラウド環境へとリフトし、コンテナやマイクロサービスを導入する企業はますます増加傾向にあります。「いまさら聞けないオブザーバビリティ」の過去回はこちらを参照。

しかし、クラウドへの移行を進める過程で、「本当に費用対効果が向上しているのか？」「従来よりも運用がかえって複雑になっていないか？」という根本的な疑問に気づくものの、それらを確認できる手段に乏しく、具体的な対応策に至らないケースが多く見受けられます。

さらに、クラウド運用中の思わぬトラブルやコストの高騰、またユーザー体験の劣化や応答遅延が発生している状況にもかかわらず、どこから手をつければいいか分からずに四苦八苦するといった悩みも珍しくないようです。せっかくクラウドに移行したのに、頻発しがちなこのような状況に対して、どのような手立てを講じればいいのでしょうか？

本稿ではまず、クラウド移行を「クラウドリフト」「クラウドシフト」「クラウド運用」の3段階に分け、各段階で発生しがちな課題を整理します。そのうえで、オブザーバビリティを活用することで実現する解決策を見ていきます。

インフラ監視とログ監視の活用やそのモダン化にとどまらずに、新たな武器としてオブザーバビリティを活用し、必要に応じてFinOpsの考え方も取り入れることで、クラウドのメリットを十分に活かしながら無駄な支出を抑え、ビジネスアジリティを維持することができます。運用に変革が起こり、クラウドがもたらす真の価値を享受でき、自信を持って説明もできるようになるでしょう。

クラウドリフト時の課題

オンプレ思考がもたらす過剰リソースの罠

オンプレミスのサーバ環境を大きく作り替えずにクラウドへ移行するクラウドリフトの段階では、物理的なハードウェア管理から解放される利点が大きくあります。しかし、オンプレ時代と同じ台数や同じ設定でインスタンスを稼働させてしまうと、実際には必要以上のリソースを確保しコスト増になっているケースがあります。

移行後にクラウドの請求額が高止まりしていても、「オンプレ時代とどれだけ差があるのか」「移行したことで本当にどれだけ効果が出ているのか」を説明するための基準が曖昧だと、調整が進まないまま割高なコストを払い続ける事態に陥りがちです。

また、インフラ監視を、従来の手法のままでクラウドへ移行するだけ、またはクラウド対応のSaaS(Software as a Service)監視に単に切り替えるだけにとどまって、動的なリソース管理やアプリケーションレベルの問題に手が回らないケースも多く見受けられます。

必要以上にインスタンスを増やしてしまい、コストが予想以上にかさんでしまったり、仮想サーバの再起動だけで対処すると、結果として問題が先送りされ、コストが予想以上に増加することもあるでしょう。

「リフトはしたけれど、結局どれだけメリットが出たのか」と振り返った時に、むしろコストが増えているといったことに気づくという残念なケースがこれにあたります。

マイクロサービス時代の可視性喪失

クラウドを“ネイティブ”に活用しようとするクラウドシフトの段階では、さらにマネージドサービス、コンテナやマイクロサービス、サーバレスといった技術を本格導入することが一般的です。

アプリケーションやアーキテクチャ自体を細かく分割することで、開発と運用のスピードや柔軟性を高められますが、それと同時にログや監視の対象が飛躍的に増えてしまい、部分的に起きている障害や遅延を見落とすリスクが高まります。

たとえば、特定のサービスだけが応答遅延を起こしていても、全体は稼働しているため、その遅延が見逃されることが典型的です。インフラ監視とログ監視を高度に併用していても、コンテナやマネージドサービスで細分化された環境の全体像を把握することは容易ではありません。

顧客がECサイトにて買い物中に、「購入処理だけができない」といった致命的な問題が起き、売り上げにマイナスの影響が出ているのに、その原因がコンテナ内部のアプリケーションコードのパフォーマンスの問題なのか、外部の決済APIの応答遅延なのか、マネージドサービスの問題なのかなど、それらの切り分けが難しいという問題も浮上します。

結果として、マイクロサービス導入をはじめとしたクラウドシフトのメリットを感じる前に、トラブルシューティングの複雑さに翻弄される現場も少なくありません。

見えざるコストと従来監視手法の盲点

リフトとシフトを終えたとしても、運用中に直面する課題はさらに厄介です。たとえば、円安の影響や従量課金の増加によって、クラウド利用は大きく変わっていないにもかかわらず、クラウド利用の請求額が急激に上がることもあり得ます。

また、マネージドサービスを気軽に追加してしまい、そのまま利用率が低い状態で月額料金だけ発生しているケースも少なくありません。こうした予算やリソースの無駄・浪費を監視するには、単なるインフラ監視とログ監視では不十分です。

クラウドをあくまでインフラとしてのみ監視運用すると、アプリケーション内部の無駄な処理や、特定の処理が高コストを要している状況を把握できず、結果として使用率が高いまま無駄な出費を放置してしまう可能性があります。

たとえば、どのマネージドサービスが実際に高い付加価値を生み出し、どのコンテナが不必要に稼働しているのかを総合的に評価できる仕組みが求められます。

課題の共通点は「見えていない」こと - 全体可視化と運用改善をセットで進める

上記のように、リフトとシフト、そして運用中であっても、クラウド利活用にまつわる本質的な課題は「どこで何が起きているかを捉えられていない」ことにあります。

インフラ監視とログ監視は不可欠な要素ですが、それだけでアプリケーション内部のボトルネックやユーザー体験への影響、マネージドサービスの利用実態といった情報まで把握するのは困難です。

そこで大切になるのが、問題の把握はもちろん、その原因特定ができるように、オブザーバビリティをシステムと組織に導入することです。

アプリケーション動作とリソース使用状況を照合

リフト後、オンプレ感覚のまま稼働させているインスタンスやマネージドサービスが過剰であれば、それを見直すところから始めるのが有効です。

オブザーバビリティが整備されていれば、CPU負荷やメモリ消費だけでなく、アプリケーションがどの程度の処理時間や量なのかを計測できるため、「この時間帯はトラフィックが少ないからインスタンス数を減らせる」「深夜はサーバを停止しても影響がない」など、具体的な改善策を打ち出せるようになります。

さらに、リフト前後の状況を定量的に比較するデータがあれば、「月々のコストがどれだけ下がったか」「どれほどパフォーマンスが向上したか」を関係者に提示しやすくなるでしょう。

サービス間の通信やAPI遅延をリアルタイムに把握

マイクロサービス化やコンテナ化が進む環境では、サービス同士の通信を横断的に観測するトレース機能や、ユーザーが実際に操作した際のレスポンスタイム、ユーザー体験の状態を的確に表現するサービスレベルを可視化する仕組みが役立ちます。

サービス間の連携状況が一望できれば、遅延やエラーがどこで起きているのかを素早く切り分けられますし、ユーザー体験の劣化が売り上げや顧客満足度にどのような影響を与えているかも定量化できます。そうすることで、単に「サーバやインフラが落ちていないから問題ない」と判断するのではなく、具体的な改善ポイントに直結する運用が可能になります。

オブザーバビリティによって、細分化されたコンテナ内部の挙動やマネージドサービスの利用上の問題などを早期に発見できれば、手段の目的化、すなわち「コンテナを導入しただけでクラウドシフトは完了した」という誤解を払拭できます。運用チームがサービス全体を俯瞰しながら必要な修正やリソース調整を繰り返し実施し、真の意味でクラウドネイティブなスピードを享受できるようになるでしょう。

戦略的なリソース分析：インフラからアプリケーションコードまで投資対効果を最大化

運用中にコストが膨らむ一因は、為替リスクとともにマネージドサービスを含めたクラウドサービスの過剰利用にあります。

オブザーバビリティを活用して、各サービスやコンテナがいつ・どれだけ使われているのか、アプリケーションの動作に対してどの程度の付加価値を生み出しているのかを把握できれば、利用していない時間帯だけスケールダウンしたり、アクセスがほとんどないサーバやDBを夜間には停止したりといった調整策を講じやすくなります。

ここでFinOpsの概念を取り入れると、投資とリターンのバランスを見失わずにクラウド環境を最適化できます。FinOpsは、コスト削減だけを目的とするのではなく、必要な投資にはリソースをかけながらビジネスアジリティを落とさずに運用するための枠組みです。

オブザーバビリティが示すデータをもとに、「この部分は冗長でコストがかかりすぎている」「該当APIのコード自体を最適化すればサーバ台数を減らしつつレスポンス向上が望める」といったインサイトを活用し、最終的に“必要なところは残し、不要なところは削る”という理想的な運用を続けることができます。

たとえば、無駄なインスタンスを止めたりサイズを縮小したりする簡単な対応は当然として、オブザーバビリティを活用してキャッシュストアを活用するなどのアーキテクチャ自体の変更判断や、アプリケーションコードの改善によるサーバやクエリの改善、データベースのリソース削減など、リソースを俯瞰したうえでトータルで負荷削減を実践することができます。コスト削減とユーザー体験の両方の改善を実現することで、結果的にビジネスの成長へと繋がります。

クラウド採用だけで満足する「手段の目的化」を脱却し、活用の価値を証明

これまで見てきたように、クラウドへのリフトやシフト時、そしてその後の運用時においても、オンプレミス環境とは異なる可視性の喪失や監視要件の複雑化を背景とした、多くの課題が付きまといます。

為替リスクによるコスト増大はもちろん、コンテナ・マネージドサービスのブラックボックス化、インフラ監視とログ監視だけでは見抜けないアプリケーション内部の課題など、問題点を放置してしまうと「クラウドを導入したのに思ったほど効果が出ない」という残念な結果を招いてしまいます。

そうした状況を脱する鍵が、組織とシステムにオブザーバビリティを採用することです。インフラだけでなく、アプリケーション挙動やユーザー体験も観測できる仕組みを整えれば、クラウドならではの動的リソース管理やサービス細分化が引き起こすトラブルを素早く捉えられます。加えて、必要なデータを得られるようになれば、FinOps的な手法を用いて“ビジネスアジリティを失わずにコストを抑える”取り組みを継続できるはずです。

クラウド導入はあくまで手段であり、最終的な目的はビジネス成果の向上にあると考えられます。リフトとシフトによって環境を整えたあとこそ、オブザーバビリティを活かして稼働実態と費用対効果を丁寧に確認し、投資優先度を見極める姿勢が必要です。

そうすることで「なぜクラウドに移行したのか」の根拠を明快に示し、“コスト削減とビジネスのスピードアップを両立している”ことが確認できるようになり、より高いビジネスアジリティを獲得できるようになるでしょう。

次回は、クラウドによるアジリティを確保したうえで、デジタルビジネスを推進する中でキーワードとなっている現代の「DX」や「内製化」を取り上げ、オブザーバビリティがどう関わっていくのかを掘り下げていきましょう。

清水毅

しみずつよし

この著者の記事一覧はこちら

クラウド移行の価値を説明できないあなたへ - 期待と現実のギャップを埋める戦略

目次