【レポート】

NTTネオメイトの前野氏が語る、仮想デスクトップのトラブル防止のポイント

 

ヴイエムウェアは昨年の11月10~11日、同社のプライベートイベント「vForum 2015 TOKYO」を都内のホテルで開催。2日目の11月11日には、「仮想化専用ストレージを活用した高品質なサービス基盤とは?」と題して、NTTネオメイト ビジネス本部 プラットフォームサービス推進部 前野秀彰氏が講演を行った。その後、この件で前野氏に個別に取材する機会を得たので、「vForum 2015 TOKYO」の模様とあわせてレポートする。

「vForum 2015 TOKYO」で講演するNTTネオメイト ビジネス本部 プラットフォームサービス推進部 前野秀彰氏

NTTネオメイトは、NTT西日本のグループ企業だ。同社は、グループ企業に対してDaaSやメール、グループウェアなどをプライベートクラウドで提供するほか、IPコールセンターやネットワークサービスなども提供する。

NTTネオメイトが提供するサービス

平成23年からは仮想デスクトップサービスも提供。現在ではその数は35,000ユーザーにも及ぶ。そして平成25年からは、サービスプロバイダとしてグループ以外の一般企業にも仮想デスクトップサービス「AQStage 仮想デスクトップ」の提供を開始し、現在では両者をあわせると5万人のユーザーが利用している。同社が仮想デスクトップサービスインフラとして利用しているのは、「VMware Horizon」だ。

比較的多く仮想デスクトップで発生するトラブル

前野氏によれば、仮想デスクトップで発生するトラブルのうち、多くは性能劣化に関するものだという。

これまであった主なトラブルには、突発的なI/Oの増加やファイルサーバとのCIFS通信の遅延による性能劣化や、プロファイル関連の障害によるユーザーデータ消失があったという。

突発的なI/Oの増加では、通常1ms程度のストレージのレイテンシが175msまで上昇。約1000名のユーザーが1時間、仮想デスクトップが利用できない状況に陥った。原因は、Google Chromeのアップデートだったという。

突発的なI/Oの増加による性能劣化

ファイルサーバとのCIFS通信の遅延については、当初、各コポーネント(ストレージ、CPU、メモリ、ネットワーク)を時間をかけて調査したが、原因がなかなか掴めず苦労したといい、最終的に判明した原因は、ファイルサーバとのCIFS通信で、QoSの優先度を上げることで解決したという。

ファイルサーバとのCIFS通信遅延

プロファイル関連の障害によるユーザーデータ消失では、バックアップデータから復旧させる必要があったが、復旧するのに時間がかかり、その間ユーザーの業務が止まる点が問題になったという。

プロファイル関連の障害によるユーザーデータ消失

仮想デスクトップでストレージ基盤に何を求めるか?

前野氏は、これらはストレージに関連するものであり、仮想デスクトップの品質を担保する上では、ストレージ自身が各VMを認識できることが必要だ」と指摘した。なぜなら、ストレージが「VM」を認識できることで、その各仮想デスクトップが正常に動作しているかどうかを判断でき、VM単位の復旧も可能になるためだという。

同氏は、「逆にストレージがLUNしか認識できない、ボリュームしか認識できないのは、非常に使い勝手が悪いと思います」と述べた。

ストレージ基盤に何を求めるか?

また、VMの性能に影響を与えている各コンポーネントの状況がEnd-to-Endで把握できる点や、何か想定外の性能問題が発生した場合、その影響を問題が発生した仮想デスクトップだけに限定できる(VMの挙動をコントロールできる)ことが求められるという。

同氏は、「なぜストレージにこのような要件を求めるのかといえば、性能劣化の原因の8割はストレージにあるからです。VMwareさんがVVOLをリリースしたのも、VM単位でストレージの品質確保ができるべきだという要求があるためではないかと思います」と説明した。

10月からディスクI/O性能を確保できる機能を追加した新サービスを提供

同社は、このような要件を満たすストレージを採用し、これまで以上に高品質な一般企業向けの仮想デスクトップサービスとして昨年の10月から提供を開始したのが、「AQStage 仮想デスクトップ スタンダードプラン」だ。新スタンダードプランの特徴は、仮想デスクトップ単位でのディスクI/O性能を確保できる新機能を追加した点だ。採用したストレージは、ティントリの VMstore「T850」だという。

同氏は「T850」を採用した理由を「VM単位で管理が可能で、これにより各仮想デスクトップの状況判断が可能になります。そのため、ユーザーからの問い合わせに迅速に対応でき、VM単位のスナップショット機能を備えていることで、VM単位の迅速な復旧も可能になります。また、各コンポーネントを管理できるツールはいろいろありますが、T850のようにストレージに付属するツールで各コンポーネント状況が把握できれば、ツールを購入する費用がなくなり、コストを抑えることができます。さらに、サービスを提供する上では、特定のお客様が非常に高い負荷をかけられと、他にもお客様にも影響が出てきますが、T850が持つVM単位でのQoS機能を利用すれば、影響を最小限に抑えることができます。特にミニマムのIOPSを設定できる点が非常に重要で、これにより、どんな状況でもサービス性能を担保でき、お客様に安心感を持ってもらえます」と語った。

ティントリのVMstoreに搭載されているOS「Tintri OS4.0」のVM単位の管理画面。レイテンシー、フラッシュキャッシュヒット率などがVM単位にわかる

「AQStage 仮想デスクトップ スタンダードプラン」では、標準で20のIOPSミニマム値を設定でき、オプションで30/40 IOPSまで拡張できる。

また、仮想デスクトップではログオン集中による会社の始業時に発生するログオンストームがしばしば問題になるが、同氏は「ログオンストームでは読み込みの負荷が大きくなりますが、読み込むのは共通部分なので、キャッシュが効いていれば解決できます。『AQStage 仮想デスクトップ スタンダードプラン』では、T850のフラッシュキャッシュと、VMware Horizonがもつストレージアクセラーレータという、サーバのメモリを使ってキャッシュする仕組みのダブルで対応できるため問題ないと思います」と回答した。

ストレージ以外のポイント

前野氏はストレージ以外のポイントにも言及し、VMware Horizonを利用した仮想デスクトップでは、1つのマスターOSから仮想デスクトップ環境をつくるリンククローンが有用だと指摘した。

実際の運用では、まず、全社共通のアプリについては、リンククローンで共通の仮想デスクトプ環境をつくり、部署ごとに異なるアプリについては各アプリを仮想化し、共通の仮想デスクトップ環境とあわせてパッケージングする方法が良いとアドバイスした。

同氏はリンククローンのメリットについて、「更新は1つのマスターOSだけに行えばよく、セキュリティポリシーも共通化できます。リンククローンではOSがログオフされるタイミングでマスターと同期されるので、ウイルスに感染しても毎日リフレッシュされます。これにより、攻撃者が攻撃できる期間を短くすることができます。リンククローンのメリットは非常に大きいと思います」と述べた。

リンククローン+ThinAppを活用した構成例

同社の負荷テストでは、「T850」1台で2000ユーザー程度の仮想デスクトップ環境が構築できるといい、同社は当面、新サービスで5000ユーザーの獲得を目指すという。



人気記事

一覧

イチオシ記事

新着記事