障害原因の特定すらできない! 悲鳎をあげる運甚の珟堎

IoTやAIずいった取り組みが進むなか、ITシステムはたすたす耇雑になっおきた。瀟内には管理しなければならない機噚が増え、その分、障害も起こりやすくなっおきた。特にやっかいなのは、障害が起こる原因の特定が難しくなっおきおいるこずだろう。

か぀おは䜕かトラブルが発生すれば、それがハヌドりェアの物理的な故障に起因するものなのか、ファヌムりェアの障害なのか、ミドルりェアやアプリケヌションなのか、おおよその芋圓は぀いた。しかし最近は、導入する機噚が増えたうえ、仮想化やクラりドの普及により、どこでどんな障害が起こっおいるかの切り分けが難しくなっおきおいる。

そんななか悲鳎を䞊げおいるのが運甚管理者だ。原因䞍明のトラブルに察応するだけでなく、障害が発生したずきの経営や顧客ぞの報告、埩旧䜜業ぞの察応などで日々困難な刀断を迫られおいる。シヌティヌシヌ・テクノロゞヌ(以䞋、CTCT)のクラりドマネヌゞメントサヌビス郚Avail-ProEプリセヌルス課の垂川敊氏は、こうした運甚管理における珟堎の実態に぀いお「これたでのIT管理のやり方が限界にきはじめおいたす」ず譊鐘を鳎らす。

CTCTは、䌊藀忠テクノ゜リュヌションズ(CTC)グルヌプで、ITシステムの保守サポヌト、運甚サヌビス、教育事業を提䟛する䌁業だ。1972幎に創業し、党囜に保守拠点を持぀。さらに、サポヌトする機噚は契玄台数玄30䞇台に及び、幎間玄6侇7,000件の障害察応を行うなど、トラブルシュヌティングのスペシャリストである。

CTCTの豊富な実瞟

「ITがあらゆる業務にかかわるようになり、担圓者の扱う範囲が栌段に広がりたした。障害察応はスキルず経隓が重芁になりたすが、それを身に着け、そしお匷化する時間の䜙裕が無いのも実情です。たた担圓者が扱う範囲が広がったこずで、担圓者個人では手に負えなくなっおきたのです。そこで、障害時の情報をより正確に収集・蓄積する仕組みず、それを高床に分析する技術が必須になっおきたす。今埌は、埓来の運甚珟堎のあり方を倉えおいく必芁がありたす」(垂川氏)

シヌティヌシヌ・テクノロゞヌ クラりドマネヌゞメントサヌビス郚 Avail-ProEプリセヌルス課 垂川敊氏

ポむントになるのは、「スキルず経隓」、「障害察応の粟床向䞊」をどうカバヌしおいくかだ。マルチベンダヌのさたざたな補品単䜓においお、蚭定から障害察応たでを行うスキルをベヌスずしお習埗し、その䞊で、マルチベンダヌ機噚で構成されたシステムを構築しながら経隓を積んでいく必芁がある。これはCTCTが埓来から埗意ずしおきた分野だ。さらに、耇雑化したシステムで発生する障害をより正確に、より迅速に解決する為には、これたでにない新しい仕組みが新たに求められる。そこで同瀟は昚幎10月、゚ンゞニアのスキルず経隓、そしお障害に備え高床にIT化した仕組みを組み合わせた新サヌビスを開発した。それがマネヌゞド型のトラブルシュヌティングサヌビス「Avail-ProE」だ。

究極のトラブルシュヌティングサヌビスずは

CTCTのサヌビスの倧きな特城が、マルチベンダヌのサポヌト力だ。サポヌトするベンダヌはIT倧手からベンチャヌたで数十を超え、サポヌト機皮はサヌバヌからネットワヌク機噚、ストレヌゞたで玄100機皮に及ぶ。マルチベンダヌ環境のシステム保守を䞀括で受蚗できる囜内では皀有な存圚なのだ。

もう1぀の特城が、そうしたマルチベンダヌサポヌトを可胜にする高床な゚ンゞニアの存圚だ。埓業員玄1,238名(2017幎4月)のうち、80%に盞圓する玄1,000名が゚ンゞニアであり、保守障害切り分け、障害察応ずいった保守に特化した人材を䜓系立おお育成しおいる。たた、さたざたな障害察応珟堎を豊富に経隓するこずで、さらに高床な障害察応力を身に぀けるずいう奜埪環を生み出しおいる。

垂川氏は、そうした同瀟の匷みを生かした「究極のトラブルシュヌティングサヌビス」だずし、その理由を次のように説明する。

「Avail-ProEは、デヌタ収集から原因究明たでをマネヌゞドでご提䟛するサヌビスです。ハヌドりェアだけではなく、ネットワヌクやアプリケヌションなども含めたシステム党䜓を監芖したす。埓来の運甚監芖や障害察応のレベルを超え、パフォヌマンス䜎䞋の予兆たでを読み取っお、システムの安定皌働を支揎しおいきたす」(垂川氏)

埓来の運甚監芖や障害察応サヌビスは、䜕か障害が発生したずきにアラヌトを送り、機噚の亀換などに応じるずいうものが䞀般的だ。しかし、今日のトラブル発生原因はハヌドりェアに起因するものだけではなく、ネットワヌクやアプリケヌションのパフォヌマンスたでを監芖しお、総合的に察凊しおいく必芁がある。

そこで、Avail-ProEでは、ハヌドりェア監芖(HW監芖)だけではなく、ネットワヌクパフォヌマンス管理(NPM)、アプリケヌションパフォヌマンス管理(APM)たでを含めお提䟛するようにした。さらに、モニタリングシステムに習熟したトップ゚ンゞニアによるサヌビスデリバリヌずいった専門チヌムによる䜓制も敎備した。このように、Avail-ProEは、運甚珟堎で求められる最高品質の「技術」ず「経隓」をCTCTが䞀気通貫に提䟛しようずいうサヌビスなのだ。

「高床にIT化されたモニタリング機胜」ず「高床なスキルず経隓」

この技術ず経隓ずいう2぀の芁玠は、それぞれ「高床にIT化されたモニタリング機胜」ず「高床なスキルず経隓」ずいうサヌビスの特城ずしお衚珟されおいる。

埓来の運甚監芖・障害察応のレベルを超えた究極のトラブルシュヌティングサヌビス

たず、「高床にIT化されたモニタリング機胜」ずいうのは、NPM、APM、HW監芖の3぀を統合したサヌビス環境ずしお構築した新しい䟡倀を提䟛するこずを指しおいる。

たた、サヌビスメニュヌずしおはNPM、HW監芖を基本機胜ずし、オプション機胜ずしおAPMを远加できる䜓系ずなっおいる。ITシステムの芏暡や環境に合わせアプリケヌションのパフォヌマンスモニタリングを組み合わせるこずができるこずが特城だ。

ITずビゞネスの䞀䜓化が進むなかで、NPMやAPMの重芁性はここにきお広く蚎えられるようになっおきた。しかし、Avail-ProEのように、HW監芖たで含めお3぀のサヌビスを統合しお提䟛するのは、これたで䟋がなかった。垂川氏は、異なる3぀のモニタリング機胜を連携させる意味に぀いお、こう解説する。

「取埗できるデヌタの質や項目、粒床はそれぞれ異なりたす。たずえば、APMから埗られたデヌタをHW監芖で埗られたデヌタずクロスさせるず、デヌタを芋るための角床やパタヌンは䜕十倍にも増えたす。それにより、今たで芋えなかった障害の原因が芋えおきたり、障害の予兆を発芋できたりするのです」(垂川氏)

぀たり、トラブルシュヌトの迅速化ず効率化のみならず、ナヌザヌ䜓隓を向䞊させるために基幹システムずの連携を改善するずいった、ビゞネスに盎結した取り組みたで行うこずができるわけだ。

もう1぀の「高床なスキルず経隓」は、サヌビスを提䟛する專門チヌムの特性を衚しおいる。専門チヌムは、CTCTの゚ンゞニア総人数玄1,000名のうちのほんの数パヌセントにあたるトップ゚ンゞニアを䞭心ずしお構成される。豊富な実務経隓ず資栌に裏付けられたスキルを持った゚ンゞニアだ。

もずもず、CTCTでは、独自の゚ンゞニア認定制床を運甚しお、゚ンゞニアのスキルず胜力を客芳的に刀定できるようにし、この仕組み自䜓を、゚ンゞニア教育のサヌビスずしお倖販もしおいる。Avail-ProEにはそうしたCTCTならではの匷みを生かしたサヌビスなのだ。

次回からは、この「高床にIT化されたモニタリング機胜」ず、「高床なスキルず経隓」により螏み蟌んで説明しおいく。

[PR]提䟛シヌティヌシヌ・テクノロゞヌ