今回は3月に開催した勉強会の様子をお届けしていきます。

3月の勉強会は「ついにGPU搭載! Azure Stack Hub with GPUの実力は?!」と題し、NTTコミュニケーションズ イノベーションセンターテクノロジー部門 AIインフラチーム 鈴ヶ嶺聡哲氏が登壇。Azureの拡張機能である「Azure Stack Hub with GPU(以下、Azure Stack Hub)」の機能/性能検証を実施した結果について解説しました。

IoTにおけるクラウドの課題とエッジコンピューティング

鈴ヶ嶺氏曰く、IoTにおけるクラウドアーキテクチャには、大きく次の3つの課題が存在するという。

  • 応答時間の遅延:IoTデバイスから取得したデータを集約し、クラウド上で分析処理などを行うため、遅延が発生してしまう。
  • プライバシー保護要件が満たせない:秘匿情報を扱う組織/企業において、クラウドではプライバシー保護要件を満たせないケースが存在する。
  • エネルギー効率が著しく低い:IoTデバイス自身でデータを送信するパターンでは、ネットワーク帯域が枯渇するなどエネルギー効率が低くなってしまう。
エッジ

さらに、注意すべきは、以下のような”落とし穴”も存在することだ。

  • データ漏洩:クラウド上にある自社アプリケーションの脆弱性を悪用され、データ漏洩が発生する。
  • データ喪失:クラウドに対する社内手続きを忘れることにより、更新処理が反映されない。
  • 認証情報、アクセス管理:GitHub上にソースコードをプッシュする際、誤って認証情報もプッシュしてしまう。

勉強会のテーマであるAzure Stack Hubは、エッジコンピューティングに分類されるソリューションである。エッジコンピューティングとは、「データソース(IoTデバイス)とデータセンター(クラウド)間に存在するコンピュータやネットワークのリソースを指す。

エッジコンピューティングは上述した課題を解決するものとして注目を集めている。鈴ヶ嶺氏は「関連する論文も2015年以降、飛躍的に増加しており、エッジコンピューティングに対する期待の高さが伺える」と説明する。

エッジコンピューティングの実用化状況としては、動画トラフィックが年々増加しているサービスにおいてユーザー体験とネットワーク効率の向上を実現した事例や、AIを使った顔認証によるイベント会場の入退場管理、ドローン空撮映像の迅速な分析など、さまざまな事例が出始めている。

事例

ただし、エッジコンピューティングでAIを活用してデータを扱う際には、非常に高い計算性能やデータ秘匿性が必要であることに留意しなければならない。

こうしたことから、鈴ヶ嶺氏のチームでは「開発効率」「計算性能」「クラウド連携」「サポート体制」の4つの観点から最適なエッジコンピューティングを模索し、研究に取り組んでいるという。

Azure Stack Hubの性能検証/機能検証

勉強会では、上述の課題感を前提に、鈴ヶ嶺氏らがAzure Stack Hubの性能/機能について検証した結果がについて解説がなされた。

機械学習ベンチマークによる性能検証

性能検証は、比較対象としてAzure、AWS、GCPといったパブリッククラウドのGPUインスタンスを選択した上で、機械学習用の業界標準ベンチマークである以下のツールを使用して行われた。

  • tf_cnn_benchmark:Tensorflowが公開している画像認識モデルCNNベンチマーク。
  • MLPerf:機械学習用の業界標準ベンチマーク。

ベンチマーク結果は、以下のようにAzure Stack Hubがパブリッククラウドよりも高い性能を示したという。

設定 結果

各クラウドの環境設定

検証結果

これを踏まえ、鈴ヶ嶺氏は「(Azure Stack Hubは)クラウドと同等、もしくはそれ以上のGPU処理性能を持っているため、AI推論や学習に必要な計算リソースを確保しつつ、エッジ処理による応答時間の遅延という課題を解決できる」と結論付けた。

3層モデルにおける機能検証

機能検証では、データソース(IoTデバイス)、エッジコンピューティング(Azure Stack Hub)、データセンター(クラウド)という3層モデルを設定し、以下の2つの検証が行われた。

  • EventHubを利用したリアルタイム推論、PowerBIによる可視化
  • Kubernetesを利用した機械学習モデルの学習

デモシナリオとして、機械学習による物体認識を用いた人物カウントの実施を想定。IoTカメラデバイスから、交差点を行き交う不特定多数の歩行者の顔画像をエッジであるAzure Stack Hub上のBlobストレージに格納し、Azure Stack Hub上のGPUのVMが推論した結果データをAzure EventHubに送る。その後、Streaming Analyticsを介してPowerBIに接続し、結果データから算出された数値をリアルタイムグラフで可視化するという流れだ。

検証

これにより、秘匿性のある人物の顔画像データをクラウド上にアップロードすることなく、推論の結果データのみを送信しているため、プライバシー保護要件を遵守した上でサービスの提供が可能になるという。

Kubernetesを利用した機械学習モデルの学習

2つ目の機能検証は、上述のデモシナリオをベースとしてAzure Stack Hub上で管理されるKubernetesクラスタを展開し、エッジ内のみでモデル学習を行って継続的な学習が可能であるかどうかを検証するものだ。

検証

検証時に構成された上図の学習アーキテクチャでは、GPU数の上限をYAMLファイルに記述することで適切なリソース管理をしつつ、エッジのみで機械学習を可能にしている。また、スケジューリングによって、新たに生成された学習モデルとリアルタイム推論VM上の学習モデルを定期的に比較し、更新を行うことも可能となっている。

鈴ヶ嶺氏は、「エッジ内のみで継続的な機械学習を行うことで、データ秘匿性確保や品質の向上、パフォーマンス向上を可能としている。Azure Stack HubはAIを活用したエッジコンピューティングに適したソリューションだと言える」と見解を示した。

* * *

エッジコンピューティングにおけるAI活用が注目されるなか、Azure Stack Hubがパブリッククラウドと同等、もしくはそれ以上にパフォーマンスを得られる可能性があるということに驚きを感じました。

クラウド間のネットワークやプロセス遅延などを最小化することで、Azure Stack Hubはハイブリッドクラウドにさらなる柔軟性を与え、AI活用を加速させるものとなるでしょう。

著者紹介

株式会社ネットワールド
Microsoft ソリューション プリセールスエンジニア
津久井 智浩(つくい ともひろ)

ソリューションディストリビューターであるネットワールドの一員として、お客様に付加価値を提供するというミッションの下、Microsoft製品を中心にオンプレミスからクラウドまで幅広く提案~導入を担当。
趣味はバイク。昼散歩が日課。最近は自分よりもカミさんの働き方改革を何とかしたいと苦悩し、マインクラフトを通して子供と一緒にプログラミングを学びたいと願う40代。3児(2女、1男)の父。