開発と運用、両部門間の「伝言ゲーム」を排し、インフラ運用の好循環を生み出した取り組み

マルチクラウド環境に基幹システムや開発基盤を展開し、製品、サービスの提供やイノベーション創出の迅速化を図っていたNTTドコモ。同社では主力で稼働している32のシステム、2000~3000程度のコンテナクラスタを、SaaSとして提供される統合型のサーバー監視分析サービスを用いて、常時監視、管理する体制を構築し、クラウド領域全体の可観測性の確保や、トラブル発生時の問題の切り分け、対応の効率化を実現している。

しかし同社ではかつて、開発部門と運用部門がそれぞれ独立した組織となっており、部門間のコミュニケーションに問題を抱えていた。システム導入時、開発部門はインフラの運用手順や対応方法をまとめた指示書を運用部門に渡すことになっていたが、そのドキュメント作成に多大なリソースを割くことを余儀なくされていたのだ。さらに運用段階においては、メトリクスやログの監視業務が半ば属人化していたため、インフラに何らかの障害が発生しても、部門間での情報共有もままならず、その解決までに時間を要するような状況だった。

Datadog Japan合同会社 提供資料
開発部⾨が運⽤業務を巻き取って
組織の⽣産性を2倍に向上
> > 資料ダウンロードはこちら

本コンテンツでは、NTTドコモが直面していたインフラ監視、管理におけるさまざまな問題の解消に向けた取り組みを、事例として紹介している。同社では開発部門が業務内容を巻き取る形で、運用部門との組織統合したことで、開発部門の業務量は2倍になったものの、インフラ運用保守のコミュニケーションコストの大幅削減、統合監視サービスによる可観測性の確保と情報共有の円滑化などにより、残業時間はむしろ減少するなど、大きな成果を挙げられているという。

ダウンロード資料のご案内

Datadog Japan合同会社 提供資料
開発部⾨が運⽤業務を巻き取って
組織の⽣産性を2倍に向上
> > 資料ダウンロードはこちら

[PR]提供:Datadog Japan