グーグル・クラウド・ジャパンは5月17日、先日に米国で行われた開発者向けイベント「Google I/O」で発表された新サービスに関する説明会をオンラインで開催した。Google I/Oでは生成AI「Bard」に関する発表などがあったが、説明会ではGoogle Cloudに関する最新のデベロッパーソリューション、プロダクト、テクノロジーが紹介された。

生成AIに対して大胆かつ責任あるアプローチ

まず、グーグル・クラウド・ジャパン ソリューション&テクノロジー部門 統括技術本部長(DB, Analytics & ML)の寳野雄太氏は「GoogleはAIファーストを実現すべく、ハードウェア、学習方法、学習モデルの3つの側面から取り組みを進めてきた。大量のデータを学習させるため、2015年にアプリケーション固有の集積回路のTPU(Tensor Processing Unit)を発表し、学習モデルとして2017年にTransformer、2018年にTransformerを利用して生まれたBERT、そして先日に大規模言語モデル(LLM)「PaLM 2」搭載のBardをサービスとして提供することを発表した」と、Googleにおける生成AIの変遷について触れた。

  • グーグル・クラウド・ジャパン ソリューション&テクノロジー部門 統括技術本部長(DB, Analytics & ML)の寳野雄太氏

    グーグル・クラウド・ジャパン ソリューション&テクノロジー部門 統括技術本部長(DB, Analytics & ML)の寳野雄太氏

前提として、生成AIは会話、ストーリー、画像、動画、音楽など、新しいコンテンツやアイデアを生み出すことができるAIの一種。そのほかのAIと同じく、膨大な量のデータで事前に訓練された大きなモデルで、一般的に基盤モデル(Foundation Model)と呼ばれるモデルで駆動する。

また、同氏はGoogle I/OでCEOのスンダ―・ピチャイ氏の「大胆かつ責任あるアプローチで、私たちは検索サービスを含むすべての主力製品を再構築している」というコメントを紹介した。

再構築に向けたカギになるものが大規模言語モデルのPaLM 2だ。同モデルは100以上の言語に対応した言語生成モデル。慣用句や詩、なぞなぞなどニュアンスを理解して生成し、数式を含む科学論文、Webを学習することでロジック、常識にもとづく推論、数学のハンドリングを可能としており、Google CloudでAPIなどとして利用が可能なほか、Googleのサービスに組み込まれている。

  • PaLM 2の概要

    PaLM 2の概要

生成AIのエンタープライズにおけるユースケースとしてチャット、複雑なデータへのアクセス、クリエイティブ領域におけるコンテンツ生成などの生産性向上の3つに大別されるという。寳野氏は「エンタープライズはコンシューマとは異なり、データの制御、コストコントール、コールセンターや検索に組み込みたいというニーズが多い。そのため、コンシューマ向けにはBard、エンタープライズ向けはVertex AIを提供している」と述べた。

ただ、社会でも話題となっている生成AIの危険性もある。その点、PaLM 2 APIは同社が2019年から導入しているAI Principles(AIの原則)にもとづき、Google CloudでAPIとしてコールするとさまざまな観点での倫理を自動チェックして結果を返すため、企業での利用において不適切な閾(しきい)値を自分でカスタマイズし、生成AIの予期せぬ有害な返信などをブロックすることを可能としている。

  • PaLM 2 APIは有毒性検出にも対応しているという

    PaLM 2 APIは有毒性検出にも対応しているという

こうした状況をふまえ、Google Cloudにおける生成AIの活用について目指すものは生成AI中心の世界ではなく、あくまでAIの専門家からビジネスユーザーまで人間中心のソリューションだという。

寳野氏は目玉のサービスとしてGoogle Workspace、Appsheet、Google Cloudでコンテンツ生成により人間と協調する生成AIである「Duet AI」を挙げており、あらゆるユーザーの生産性を向上するとしている。

  • Google CloudではAIの専門家からビジネス―ユーザーまで人間中心のソリューションと位置付けている

    Google CloudではAIの専門家からビジネス―ユーザーまで人間中心のソリューションと位置付けている

  • 「Duet AI」の概要

    「Duet AI」の概要

「Google Workspace」と「AppSheet」への生成AIの適用

続いて、グーグル・クラウド・ジャパン ソリューション&テクノロジー部門 Google Workspace 事業 カスタマーエンジニアの中之薗朔氏が生成AIが組み込まれた「Google Workspace」とノーコード開発プラットフォーム「AppSheet」のアップデートを解説した。

  • グーグル・クラウド・ジャパン ソリューション&テクノロジー部門 Google Workspace 事業 カスタマーエンジニアの中之薗朔氏

    グーグル・クラウド・ジャパン ソリューション&テクノロジー部門 Google Workspace 事業 カスタマーエンジニアの中之薗朔氏

まずは、Google Workspace。中之薗氏は「Google Workspaceにおける生成AIのビジョンは人々の創造とコラボレーションを実現することだ。GmailとMeet、Chatのコラボレーション系ではやり取りの要約や文章作成支援、自動翻訳、自動的な議事録作成などとなり、Docs、Sheets、Slidesのファイル系は文章の要約・校正に加え、イメージ作成、データ分類などだ」と説明した。

Google Workspaceの各アプリケーションに生成AIを適用させ「Duet AI for Workspace」として複数の新機能を発表している。

GmailとGoogle ドキュメントでプライベートプレビューとして提供中の「Help me write」は、目的に沿ったドラフト作成を支援し、書きたいトピックを数単語入力するだけで、すぐにドラフトを作成するほか、生成したドラフトを適切なトーンにワンクリックで変更でき、メールの送信相手が丁寧さを求めるのであればフォーマルなトーンとすることが可能。

  • 「Help me write」の概要

    「Help me write」の概要

また、モバイルにも対応し、スマートフォンに書き溜めたメモ書きを議事録にしてチームに共有し、デバイスや場所を問わず受け取る人を中心にとらえて最適なメッセージを届けることができる。

Google スライドの「Help me visualize」とGoogle スプレッドシートの「Help me organize」、Google ドキュメントにおけるHelp me writeとスマートキャンバスは今後プライベートプレビューを予定。

Help me visualizeはオリジナルのビジュアルコンテンツを生成し、欲しい画像のイメージを入力すると画像を生成し、Help me organizeはデータをAIで自動的に分析・整理を行い、スプレッドシート内のデータ分析、テーブル、グラフなどのビジュアル化が可能。特別なスキルを必要とせず、Connected Sheetsと併用して膨大な量のデータからインサイトを抽出することを可能としている。

  • 「Help me organize」の概要

    「Help me organize」の概要

Help me writeと、スマートチップやテンプレートといったインタラクティブな要素を持つスマートキャンバスの連携では、AIによる文章推敲と情報の一元化を行い、例えばプロジェクト管理で共有したいファイルやアサインしたメンバー、期日、ステータスなどをスマートチップで表現し、プレビュー表示や変数として扱えるという。

  • Help me writeとスマートキャンバスが連携する

    Help me writeとスマートキャンバスが連携する

一方、AppSheetではノーコードによるチャットアプリ作成と「Duet AI for AppSheet」でのアプリ作成を発表。チャットアプリ作成はノーコードでGoogle Chatのアプリ連携を作成でき、コミュニケーションに加え、ワークフローの自動化や申請プロセスの簡略化、アラートのリアルタイム共有などをチャットで一元化できる。

Duet AI for AppSheetは、自然言語でアプリ作成を可能とし、会話をしながらのアイデア出し、開発、カスタマイズができる。アプリは許可されたポリシーの範囲内で作成され、確認・調整すればすぐに現場に実装できる。

  • 「Duet AI for AppSheet」の概要

    「Duet AI for AppSheet」の概要

中之薗氏は「AppSheet関連の発表は市民開発の適用範囲を拡げつつ生産性を向上させ、DXの促進が期待される」と強調していた。

Google Cloudのソリューションへの生成AIの適用

最後に、グーグル・クラウド・ジャパン ソリューション & テクノロジー部門 AI/ML 事業開発部長の下田倫大氏がGoogle Cloudにおける生成AIをサポートした機能群を説明した。Google I/Oで発表された生成AIのプロダクトカテゴリは「Generative AI App Builder」と「Generative AI support in Vertex AI」となる。

  • グーグル・クラウド・ジャパン ソリューション & テクノロジー部門 AI/ML 事業開発部長の下田倫大氏

    グーグル・クラウド・ジャパン ソリューション & テクノロジー部門 AI/ML 事業開発部長の下田倫大氏

プライベートプレビューで提供しているGenerative AI App Builderは、エンタープライズ要件を満たした基盤モデルによるチャットと検索の新しいユーザー体験を提供するアプリケーション開発を可能とし、「Conversational AI」「Enterprise Search」がある。

  • 「Generative AI App Builder」の概要

    「Generative AI App Builder」の概要

Conversational AIの事例として、自転車販売のアプリにAIチャットを組み込んだものを下田氏は示した。ユーザーがアプリ上で会話形式で「トライアスロンをしながら通勤でも使える自転車を探している」と話しかけ、それに対してAIがエキスパートとして相談にのり、複数の自転車を提案。

その中でユーザーが気になったものがあり、すでに保有している自転車と比較するために画像をアップロードすると、AIが画像を読み込み、型番を理解して比較表を作成、ユーザーは追加でフレーム素材を尋ねたがAIは一般的な回答として情報がないと返信したため、一度考えると告げるとAIがサマリーを作成して会話を終了する。後日、再度AIに話しかけると前回からの会話の続きから始まり、購買の意思を示すと予約システムと連携して確定させるという流れとなっている。

下田氏は「設定は、非常に簡単でパブリックに公開されているWebサイトの情報やドキュメントをアップロードし、検索かチャットのどちらかを選び(両方選択も可)、ビジネスフロー(予約や返金など)の設定は生成AIの機能を使えば自然言語で条件を書き下すことも可能になっている」と説く。以下が動画だ。

次はGenerative AI support in Vertex AIについて。Vertex AI自体は従来からエンドツーエンドの機械学習プラットフォームとして提供し、パブリックプレビュー中の「Vertex AI Model Garden」は、PaLMをはじめ、Googleの基盤モデルやタスクに特化したソリューション、オープンソースモデルを探索し、テストドライブするためのワンストップショップとなり、ML(機械学習)のユーザージャーニーを一カ所で管理するというものだ。

あらかじめ用意されたテンプレートで基盤モデルを直接使用することに加え、業界やユースケースに合わせたデータとプロンプトによるモデルのチューニング、データサイエンスノートブック、Vertex AI Pipelinesでオープンソースモデルのカスタマイズ、言語や資格、音声などのタスク特化ソリューションへのAPIアクセスを可能としている。

  • 「Vertex AI Model Garden」の概要

    「Vertex AI Model Garden」の概要

「Generative AI Studio」は、生成AIのワークフローを実現する統合インタフェース。プログラミングなどの知識がなくても利用できる直感的なインタフェースを備え、プロンプトエンジニアリング、ファインチューニングなどのチューニングに対応。また、APIコードを迅速に生成・カスタマイズしてアプリケーションに組み込み、複数のデータ形式にも対応しており、パブリックプレビュー中だ。

  • 「Vertex AI Model Garden」の概要

    「Generative AI Studio」の概要

「PaLM for Text and Chat」はGoogleの大規模言語モデルをビジネスに活用し、エンタープライズ用途へのPaLM 2に適用することで質問、要約、分類、アイデア作成など、さまざまな用途に活用が可能。ユースケースはセンチメント分析やテキスト書き換え、広告コピーの生成などを想定し、こちらもパブリックプレビューとなる。

  • 「PaLM for Text and Chat」の概要

    「PaLM for Text and Chat」の概要

Vertex AIではプライベートプレビューの「Imagen for Text-to-Image」「Codey for Text-to-Code」、パブリックプレビューの「Chirp for Speech to Text」の3つの新しい基盤モデルも発表している。

  • 3つの基盤モデルを発表した

    3つの基盤モデルを発表した

Imagen for Text-to-Imageは、シンプルなテキストプロンプトを使用して高品質の画像を生成、編集ができる。独自データをアップロードし、製品やロゴを含む画像を生成するほか、マスクフリー編集、アップスケーリングなどの機能でカスタマイズし、画像の説明を作成することでコンテンツにラベル付けを可能としている。

Codey for Text-to-Codeは独自にカスタマイズされたリアルタイムコード補完と生成により、ソフトウェア開発を迅速化させるという。Codeyモデルを独自のコードベースで調整し、アプリケーションに組み込むことに加え、現在のコードと次の数行のコードを提供することで自然言語記述からコードを生成できる低遅延コードを支援するという。そのほか、コーディングに関する質問はコーディングボットに依頼し、コードがGoogleや他の人に共有されることはないという。

Chirp for Speech to Textは、世界中の視聴向けに音声対応アプリケーションを構築。20億パラメータ規模の音声モデルを作成するための何百万時間の音声に対する自己教師付きトレーニングを行っており、英語で98%の精度、マイナーな言語は300%以上の相対的な改善を達成しているという。

そのほか、モデルのチューニング手法としてプライベートプレビュー版で「Reinforcement Learning from Human Feedback(RLHF)」を提供。

人間の「どう感じたか」というフィードバックを生成AIに反映することで、人間にとって自然な対応へと改善を行う手法をサポートし、RLHF調整モデルは通常サイズを大きくすることなく、他のトレーニング方法と比較して正確で信頼性を高くすることができる。

  • 「Reinforcement Learning from Human Feedback(RLHF)」の概要

    「Reinforcement Learning from Human Feedback(RLHF)」の概要

加えて、医療、金融、ECなどでユーザーのニーズを理解して対応できるようにモデルをトレーニングでき、最終的には顧客満足度やエンゲージメントの向上につながるという。