先日、年次のグローバルカンファレンス「Google Cloud Next '22」を開催したGoogle Cloud。初日の基調講演後にはメディア向けの説明会が開催され、カンファレンスで発表した各種サービスが紹介された。
企業がクラウドに移行する理由の変化
冒頭、グーグル・クラウド・ジャパン ソリューション&テクノロジー部門 技術部長(DB, Analytics & ML)の寳野雄太氏は「クラウド市場は非常に成長しており、依然として初期段階だ。市場の成長は新しいビジネス、新しい技術ニーズにけん引しており、あらゆる業界でデジタル変革が進みつつある。初期段階のクラウド市場は、これまではクラウドに移行することでTCOの最適化がメインになっていたが、クラウドに移行する理由が大きく変化している」との認識を述べた。
同社が2022年のIT投資をけん引する10の技術イニシアティブを調査したところ、セキュリティ/リスクマネジメントやデータ/ビジネス分析、アプリケーション/モダナイゼーション、技術による顧客体験の向上などが上位を占め、こうしたニーズはGoogle Cloudの強みと一致するという。
そのため、同社ではデータクラウド(Intelligence)、オープンクラウド(Modernization)、コラボレーションクラウド(Hybrid Workplace)、トラステッドクラウド(Cybersecurity)で構成する「トランスフォーメーションクラウド」を戦略として推進し、顧客を支援している。
データクラウドの新サービス
その中でも今回はデータクラウド、オープンクラウド、トラステッドクラウドについて重点的に説明した。
まずはデータクラウド関連の新サービスを寳野氏が解説した。データにはアプリケーションデータ、予測、可視化&利用、分析の4種類の使い方があると同氏は説明する。しかし、経営層の24%しか自組織がデータドリブンとしか感じておらず、スキルギャップの存在やデータの複雑性、スケールさせていくことに課題を抱えている。
スキルギャップを埋める「Translation Hub」
そこで、Google Cloudではスキルギャップを埋めるために学習済みモデルとAIソリューション、「Auto ML」や「BigQuery ML」を利用したカスタムAI、高度なツールを利用したカスタムAI開発をはじめ、すぐに利用できるものからDIYで開発できるCloud AIを提供してきている。
今回、そうしたサービスのラインアップに「Translation Hub」を追加した。同サービスはドキュメント翻訳AIとなり、PDFやPowerPoint、ドキュメント、Googleスライド、同ドキュメントなどの翻訳ができる。
135言語に対応し、数秒で翻訳、機械翻訳後の編集にも対応しており、方有無翻訳モデルのAutoMLを利用して独自の翻訳モデルを適用できる。これまでエンジニアだけが利用できた翻訳サービスだが、ツールとしてビジネスユーザーが利用できるようになった。
また、「Vertex AI Vision」は画像・動画AIアプリケーションの開発が可能。画像AIを利用したアプリケーションをデータ取り込みから分析、ストレージ、デプロイまでを1つのインタフェースで開発でき、リアルタイムビデオストリームからのデータ取り込みが数クリックでできるという。
アナリティクスプラットフォームの「BigQuery」や「Vision Warehouse」との統合で機械学習モデルの予測結果、ビデオストリーミングを保存・検索を可能とし、出力結果をBigQueryやLookerに出力し、インサイトを得られるとしている。
BigQueryが非構造化データをサポート
データの複雑性に関しては、プレビュー版で「BigLake for Unstructured Data / BiqQuery ML for Unstructured Data」を発表し、BigQueryがドキュメントや画像、動画など非構造化データをサポート。これまでデータレイクと認識されてきたBigQueryがDWH(データウェアハウス)と統合し、SQLで操作するパイプラインの構成が可能。
なお、BigLakeは今年4月にDWHとデータレイクを統合したデータ制限を撤廃するストレージエンジンだ。
BigQueryのSQLから画像、翻訳、テキスト処理など、Googleの機械学習技術を活用し、単一のプラットフォームで非構造化データの分析結果を構造化データとつなげることができるという。
さらに、プレビュー版の「Spark in BigQuery / Apache Iceberg」はオープンで統合された分析を可能とし、SQLとともにSparkを利用することで非構造化、半構造化データの処理を行い、ストアドプロシージャとしてSparkジョブを実行する。また、オープンソースのテーブルフォーマットであるApache Icebergをサポート。
同サービスの課金体系はBigQueryの利用料金に統合され、利用ユーザーはSparkインフラストラクチャを機にすることなく、BigLakeがセキュリティを担保し、MetastoreからBigQueryテーブルにもシームレスにアクセスできる。
また、トランザクションデータをニアリアルタイムで分析する「Datastream for BigQuery」もプレビュー版を提供。Google Cloudが提供するPostgreSQLと完全互換性を持つフルマネージド型の「Alloy DB」やPostgre SQL、MySQL、オラクルなどのデータベースからテーブルをBigQueryにニアリアルタイムでレプリケーションできる。サーバレスで自動スケールし、運用は不要となり、数クリックでテーブルの更新差分だけを常に同期が可能。
加えて、AlloyDBと分散データベース「Cloud Spanner」による機械学習モデルのサービングにより、トランザクショナルデータベースと機械学習の融合を可能としている。これにより、Vertex AIで作成したモデルを使い慣れたSQLで予測結果を得ることでアプリケーションに簡単に組み込めるという。
旧Google データスタジオを「Looker Studio」に
スケールについては、データ活用を行う中で可視化とBIの要素が重要となり、これまでGoogle Cloudではさまざまなユースケースに対応するデータプラットフォームとして「Looker」を提供してきた。今回、無料で使えるセルフサービスBIの旧Google データスタジオを「Looker Studio」に統合した。
一般的にセルフサービスBIは、簡単にダッシュボードを作成して知りたいことを分析し、チーム内で共有するものとして利用されていたことから、多様なデータソースを取り込めることがメリットだった。
従来からGoogle Cloudでは、セルフサービスとは正反対の集中管理を行うデータアプリケーションとして買収した「Looker」を提供していたが、ポートフォリオにLooker Studioを加えるとともに、有償版の「Looker Stuido Pro」も用意したことで、より多くのユーザーニーズに対応するという。