グーグル・クラウド・ジャパンは10月26日、オンラインで三菱重工業におけるGoogle Cloudの採用事例について記者説明会を開いた。
Google Cloudのデータクラウド
冒頭、グーグル・クラウド・ジャパン 技術部長(アナリティクス/機械学習、データベース)の寳野雄太氏は「これまでのポイントソリューションでは、複数のシステムによりデータが分散し、信頼性が損なわれていた。そこで当社が打ち出しているものがデータクラウドだ」と述べた。
Google Cloudにおけるデータクラウドは、データにもとづいた意思決定を実現するための「アナリティクス」、予測と最適化による顧客体験の向上を図る「AI/機械学習」、変化に対応できるデータ環境の「トランザクション」を兼ね備えているという。
寳野氏は「Googleのデータクラウドを利用することでデータを投入すれば、データ価値をリアルタイムかつシームレスに引き出せることができる」と強調する。
続いて、グーグル・クラウド・ジャパン AI/ML スペシャリストの児玉敏男氏が機械学習プラットフォームの「Vertex AI」について説明した。
児玉氏は「ある調査機関によると、ML(マシンラーニング)プロジェクトの87%以上が本番運用化されていないと報告されているが、一般的にローンチは易く、運用は難しいと言われている。これには、さまざまな理由があるものの、MLシステムの問題は継続的に運用していく中で見つかると報告されている」との認識を示す。
同氏によると、例えばモデル作成のためのコーディングはシステムの一部にしかすぎないが、エンジニアはモデルの作成に焦点を合わせすぎており、同様のことはMLアプリの開発者にも当てはまり、予測精度が高いモデルが作成された際に簡単に本番環境に投入しようとするという。
児玉氏は「よくよく考えてみれば、通常ビジネスアプリケーションのシステム開発では、包括的なテストをせずにアプリを本番環境に移行することは決してない。また、ソース管理の計画を立てずにコーディングを開始することもない。しかし、MLプロジェクトでは全体の運用を考慮しないでスタートさせてしまうことが現実的にある。MLモデルは学習データに推論の品質が依存しているが、実際にデータは絶えず変化しており、MLを実施する本番環境は複雑なものになる」と指摘。
つまり、データが変化するとモデルも精度が下がるということだ。そのため、新しいデータを収集し、モデルを作成してパフォーマンスを監視しながら推論を行うまでのフロー全体を統合しつつ、運用システムで常に品質を管理するMLOpsを導入していく必要があるという。
そこで、同社では5月にVertex AIの提供を開始している。同プラットフォームは、Googleのマシンラーニングの実践投入から得たノウハウを利用でき、自動でモデルを作成するAutoML、コードを書くカスタムトレーニングを備え、モデルの保存・デプロイ、予測のリクエスト、継続的な監視・更新・ガバナンスをはじめ、実運用で必要なサイクルをサポートしている。