グーグル・クラウド・ジャパンは12月17日、オンラインでGoogle CloudとGoogle Workspaceの新サービスに関する記者説明会を開催した。
「Gemini 2.0 Flash」が試験利用開始
まず、グーグル・クラウド・ジャパン 執行役員 テクノロジー部門 兼 事業開発本部の寳野雄太氏は先日発表したAIモデル「Gemini」の最新バージョン「Gemini 2.0 Flash」がAI統合プラットフォーム「Vertex AI」で試験利用が可能になったことについて触れた。
同氏は、Gemini 2.0 Flashに関して「Gemini 1.5 Proと比べて動作が2倍高速になり、リアルタイムに音声、動画、テキストを受け付けて、音声やテキストを出力する。また、性能改善の一例として自然言語からのコード生成における改善ではGemini 1.5 Flashと比較して13.1%の性能の改善を図った」と述べた。
そのほか、Gemini 2.0 Flashでは従来はテキストのみの出力だったが音声での出力ができ、インライン画像出力とテキストの生成として対話しながら画像の編集が可能。さらに、リアルタイムで画面共有など自身が閲覧しているものを共有して、双方向的なやり取りやや割り込みなど自然な会話ができる「Multimodal Live API」を実装した。
また、画像生成AI「Imagen 3」の新機能として「編集」と「カスタマイズ」の一般提供を開始。編集では挿入&削除やアウトペイント、商品・背景の編集をはじめ、マスクを使用して既存の画像に変更を加えることが可能になり、カスタマイズではマスクなしの参照画像から作成ができるという。
さらに、プライベートプレビュー版として提供を開始した「Veo on Vertex AI」は、プロンプトからの動画生成や既存の画像に対して、動きを追加することが可能となっている。
こうしたGemini 2.0を支えるインフラとしてGoogle Cloudの第6世代TPU(Tensor Processing Unit)「Trillium」も一般提供を開始し、前世代の「TPU v5e」と比較したパフォーマンスは、トレーニングで4倍、推論で3倍にそれぞれ向上しており、東京リージョンでも利用を可能としている。
Google Workspaceのライセンスがなくても利用可能な「Google Agentspace」
次に寳野氏は「Google Agentspace」の説明に移った。同氏は「エンタープライズにおける生成AIの活用はコンシューマーのユースケースより複雑。ある調査では、89%の従業員が生成AIの利用に際して6つ以上のデータソースから情報を検索している。これにより、ユーザー体験の悪化やプライバシーとデータ流出のリスク、生産性の低下といった問題を誘発している」と指摘。
こうした問題を解決するものとして提供を開始したものがGoogle Agentspaceだ。同サービスはデータがホストされている場所を問わず、Geminiの高度な推論やGoogle品質の検索など、企業におけるすべてのデータを統合するエージェント。
寳野氏はGemini for Google Workspaceとの違いについて「AgentspaceはGoogle Workspaceユーザーのみに重きを置いているわけではなく、さまざまな企業にエージェントをGeminiを活かし、安心・便利な形で利用できる。つまり、Google Workspaceの導入の有無にかかわらず同じ効果が得られる。Agentspaceが提供する価値は異なる。エージェントの付加価値と検索、情報のディスカバリーといった付加価値が統合されていることがポイントだ」と述べている。
AgentspaceはGoogle Workspaceのライセンスがなくても利用でき、企業内における複雑な情報の探索や専門的な知識を持つエージェントが業務上の役目を自動化するほか、「NotebookLM Enterprise」を利用した企業データの新しい活用方法を提示してくれるという。
複雑な情報の探索では、画像やビデオを理解する検索テクノロジーや、さまざまな知識(ナレッジ)を体系的に連結してグラフ構造で表した知識のネットワークであるナレッジグラフ、Google Web検索を可能としている。
また、SlackやSharePointなどGoogleソース以外の多くのエンタープライズエコシステムをカバーし、アプリケーション側のACLs(アクセスコントロールリスト)を利用して、データをユーザーごとの制御ができる。セットアップも容易であり、インデックス取り込み時のコンテンツフィルタといった高度なコネクタ設定ができるという。
専門的な知識を持つエージェントについては、構成済みエージェントに加え、ローコード/ノーコードのHRエキスパートや営業エキスパートをはじめとしたエージェントフレームワークの作成が可能。
NotebookLM Enterpriseは、AIによる調べものや文章作成を支援するエージェントとなり、企業内の文章やナレッジなどにもとづいて、質問に関した情報の検索、要約、知見を得ることをサポートする。WebサイトやGoogle Slides、同Docs、PDF、テキスト、YouTubeのURL、音声のほか、新たにMicrosoftのWord、PowerPoint、Excelなどのデータソースに対応している。
利用方法は上記のデータソースをアップロードして、NotebookLMがソースにもとづいた情報を提供し、音声による要約やブリーフィング文章、概要を自動生成する。NotebookLM Enterpriseは企業向けのため、高度な認証、データ保護への対応や導入済みの企業内IDの利用を可能とし、Cloud IAMでの権限共有なども可能だ。
なお、Agentspaceは、スタンドアロンのNotebookLM Enterprise、「Google Agentspace Enterprise」「同Plus」の3つの販売エディションを揃え、日本語対応に加え、日本国内対応も予定している。