デジタルサービスの提供が企業の競争力を左右する時代。しかし、新しいサービスの開発に注力するあまり、それを支えるIT運用の革新がなおざりになっている企業も多い。デジタルトランスフォーメーション(DX)が先行する企業では、顧客満足度の低下という痛い経験から、AIを活用した次世代のIT運用「AIOps」への転換を加速させている。本稿では、Dynatrace合同会社の執行役員でエバンジェリストを担う日野 義久氏に話を伺い、DXに取り組む企業が今から備えるべき課題と解決策を探る。

インタビュイープロフィール

Dynatrace合同会社 執行役員 エバンジェリスト 日野 義久氏

IT業界での長年の金融業界担当経験を踏まえて、2017年よりデロイトトーマツコンサルティングにて、企業のDX立ち上げ支援プロジェクトに参加し、最新のSaaS業務ソフトやRPAツールを利用したDXプロジェクトをリード。 2021年6月より現職にて、金融業界でのDXを最新のテクノロジーを利用することでさらに加速させることが可能となる仮説の元、AIを高度に利用した自動化技術によりデジタル・サービスを可視化するソリューションの展開を推進中。

複雑化するITシステムが突きつける深刻な課題

DXの推進により、企業のITシステムは急速に複雑化している。クラウドネイティブ技術の採用、マイクロサービスアーキテクチャの導入、コンテナ化の進展など、システム環境は日々進化を続けている。

この変化は同時に大きな課題をもたらしている。Dynatraceが実施したグローバルにおけるCIO調査(※1)では、現代のIT部門が直面する深刻な課題が浮き彫りになった。システム全体の可視化の難しさに72%のCIOが課題を感じており、また74%が監視に関わる工数とコストの増加に直面している。

特に深刻なのが、複数の監視ツールを併用することによる負担である。インフラ、アプリケーション、ユーザー体験など、それぞれに異なるツールを導入した結果、ライセンスコストの増大に加え、ツールごとの保守や運用管理の工数も膨らんでいる。ある大手通信事業者では、16の異なる監視ツールを利用しており、これらを統合することによって削減できるであろうコストは5年間で55億円にも上るという。

さらに、インシデントが発生した際の対応コストも看過できない。従来型の運用では、システム障害が発生してから対応するため、深夜や休日の緊急対応が頻発する。その結果、残業や休日出勤による従業員の負担が増し、働き方改革推進の妨げとなるだけでなく、ビジネス機会の損失という重大な経営課題にもつながる。

このような状況下で、増加するIT運用の作業負荷に対処し、ビジネスに最大の価値を提供するためにはAIの支援が不可欠と考えるCIOは、実に93%にものぼる。

  • (図)欧米のCIO調査結果から見えるIT運用監視の課題

AIが実現する予防型IT運用の新時代

こうした課題に対し、Dynatraceは「AIOpsを実現する次世代統合運用プラットフォーム」という新しいアプローチを提案している。従来の監視ツールが個別の要素の監視に留まっていたのに対し、Dynatraceはオンプレミスからクラウド、コンテナまであらゆるシステム環境を対象としている。システムインフラからアプリケーション、ユーザー体験までシステム全体を一元的に可視化し、AIを活用して問題の検知から解決までを自動化する点が特徴である。

「監視(モニタリング)から観測(オブザーバビリティ)へ。オペレーションからエンジニアリングへ」と、日野氏は、同製品のコンセプトを説明する。

「従来の運用では、問題が発生してから対応する事後対応が中心でした。しかし現代のデジタル中心のビジネスでは、問題が顕在化する前に予兆を検知し、対処することが求められます」(日野氏)

その中核となるのが、“Davis® AI”と呼ばれるAIエンジンである。Davis AIは次の3つのAI機能を連携させることで、問題の検知から解決までを包括的に支援する。 まず「予測AI」が、機械学習と統計モデルを用いて異常や予兆の検知を行う。たとえば、通常は100ミリ秒のマイクロサービス処理時間が150ミリ秒に遅延するといった微細な変化も、ユーザーが影響を感じる前に検知できる。

次に「因果AI」が、検知された問題の根本原因を特定する。従来のAIと異なり、あらかじめ分析モデルが組み込まれているため、導入企業での学習期間は不要である。システムの複雑な依存関係を理解し、問題の真の原因を即座に特定する。

さらに「生成AI」が、問題の自動処理や分析作業の支援を行う。収集されたデータの分析やダッシュボードの自動生成に加え、今後解決策の自動提案機能も提供予定である。

  • (図)Dynatraceの導入効果

さらにDynatraceのプラットフォームテクノロジーを支えているのが、OneAgentと呼ばれる単一のエージェントである。各ホストに導入するだけで、ホストの環境を分析し監視項目とその閾値を設定し、システム全体の監視が自動的に開始される。収集されたデータは、Grail™データレイクハウスによって意味のある形で自動的に保存・整理される。PurePathⓇによってトランザクションの内部構造が把握され、Smartscapeによってシステムの依存関係が可視化される。さらに、AutomationEngineによって、検知された問題に対する修復作業の自動化が実現される。

  • (図)プラットフォーム・テクノロジー

「Dynatraceは正確な問題検出と原因特定にこだわっています。『多分こうだろう』という曖昧な分析結果は報告しません。それにより、その後の、システムの復旧等の自動化もリスクなく実行できるのです」と日野氏は同製品の特徴を強調する。

このような統合的なアプローチにより、Dynatraceは米調査会社ガートナーのオブザーバビリティプラットフォームのマジック・クアドラントにおいて、リーダーの1社に位置づけられている。クラウドネイティブ環境からレガシーシステムまで、企業の多様なIT資産を包括的に管理できる点が高く評価されている。

大手クレジットカード会社に学ぶ、顧客満足度回復を実現したIT運用改革

実際に、Dynatraceはどのような効果を発揮しているのだろうか。大手クレジットカード会社A社の事例は、DXに取り組む企業が直面する課題を鮮明に示している。 同社はDXの取り組みを進めるなかで、ITサービスの品質に課題が生じ、顧客満足度を大きく損なう事態に直面した。サイロ化された複数の監視ツールでは迅速な対応が困難となり、システム障害からの平均復旧時間(MTTR)は4時間にも及んでいた。

「既存の監視ツールと運用体制による改善では解決が難しく、顧客満足度の回復とビジネス成長の促進のために、IT運用のイノベーションが必要でした」と日野氏は説明する。

同社はDynatraceの導入により、エンド・ツー・エンドの可視化とAIを活用した正確な根本原因の特定を実現。その結果、MTTRを4時間から15分へと94%短縮することに成功した。「顧客に大きな影響が出る前に問題を特定し、解決できるようになりました」と日野氏は効果を語る。

上記のA社における事例は、今まさにDXを推進している企業にとって重要な示唆を含んでいる。特に現在、企業の多くはDXの取り組みを本格化させている段階にある。クラウドネイティブ技術の採用やマイクロサービス化が進むなか、システムの複雑化は避けられないだろう。

「日本企業は今、先進的な米国企業が直面してきた課題を未然に防げる立場にあります。DXを進める際に、同時にIT運用の改革も行うことで、顧客満足度の低下を防ぎながら、スムーズなデジタル化を実現できます」と日野氏は指摘する。

事例から読み解くDXの”落とし穴”: エンジニア人材を活かせない企業の課題

ここで、事例を通じて、企業が直面する典型的な課題を考えてみよう。大手小売業の企業B社では、EC事業の強化を掲げ、新規サービスの開発を加速させていた。スマートフォンアプリの刷新、パーソナライズド施策の強化、実店舗との在庫連携などに着手。次々と新しいデジタルサービスを展開し、アプリケーションのリリースサイクル短縮にも取り組んでいた。しかし、IT運用の体制は従来のままで、新しいシステム環境への対応が追いついていなかった。

クラウドネイティブ環境の導入により、システムの依存関係は複雑化。問題が発生しても原因特定に時間がかかり、深夜や休日の緊急対応も増加していった。 さらに、人手不足も深刻な課題であった。新規開発のための人材が不足する一方で、運用保守にかかる工数は増大。特に問題だったのは、深夜や休日の緊急対応によって、本来は新機能の開発や品質改善に充てるべき優秀なエンジニアの時間が奪われていたことである。

「システム障害への対応は、その企業のシステムをよく理解した優秀なエンジニアが担当せざるを得ません。その貴重な人材の時間を事後対応に費やすことは、企業にとって大きな機会損失となります」(日野氏)

ベテランエンジニアの負担は増える一方で、若手の育成も滞りがちになっていた。計画的な技術継承や新技術の習得の時間が確保できず、チーム全体の技術力向上にも影響が出始めていたのである。その結果、アプリの応答遅延やシステム障害が増加し、SNSでの批判も目立ち始めた。

  • (イラスト)ベテランエンジニアに負担が偏っているシーン

こうしたB社のような状況は、多くの日本企業が直面している、あるいは今後直面するであろう課題を示している。

「事後対応型の運用では、エンジニアの働き方改革も難しい状況となります。AIを活用した予防保守型の運用に移行することで、問題を業務時間内に計画的に対処できるようになります。これにより、エンジニアは本来注力すべき価値創造的な業務に時間を使えるようになるのです」(日野氏)

システムの複雑化による運用負荷の増大は、単なる効率の問題だけでなく、貴重なIT人材の有効活用という観点からも、早急な対応が必要な経営課題となっているのである。 「アプリケーション開発と運用のDXは表裏一体の関係にあります。DXを本格化させる今だからこそ、次世代の運用基盤の整備に着手すべきなのです」——この日野氏の言葉は、デジタル時代における企業の成長戦略において、IT運用の革新、すなわちAIOpsの導入が不可欠であることを示唆している。

  • (イラスト)AIOpsの導入により得られる効果

実際、日本でもデジタルサービスを展開する小売業や金融機関を中心に、予防的なIT運用の重要性が認識され始めている。DXの推進により、システム障害が事業に与える影響はますます大きくなっている。AIOpsの考え方を中心とした運用体制の構築は、限られたIT人材を効果的に活用しながら、デジタル時代の競争力を高めていくための重要な検討課題となるだろう。

(※1) 出典: 2020 グローバルCIOレポートより(Dynatrace独自調査 2020年11月発行)

企業プロフィール

Dynatrace合同会社
〒100-0005 東京都千代田区丸の内1-4-1 丸の内永楽ビルディング25F