米Googleが9月4日(現地時間)に開催したMade by Googleイベントで「Google Assistant with Bard」を発表した。Googleアシスタントに、大規模言語モデル「PaLM 2」を活用した対話・生成AIである「Bard」(現在試験運用中)を統合したサービスになる。「今日の天気は?」「10分のタイマーをセットして」といった従来通りのGoogleアシスタントへのリクエストに加え、Bardによる高度な応答が可能になり、幅広い質問やタスクに対応できるようになる。
Googleは9月に、Bardに「Bard Extensions」という拡張機能を追加した。Webだけではなく、Google Workspace(Gmail、Googleドライブ、Googleドキュメント)、Googleマップ、Googleフライト、Google HotelsといったGoogleの各種ツールからも関連情報を検索し、ユーザーのプロンプトに対してパーソナライズした応答を提供する。例えば、旅行中にガソリンスタンドを探す際に、Googleマップを開かなくても、Bardに「近くにガソリンスタンドはありますか?」と聞くだけで、現在地に基づいたGoogleマップからのローカル情報を取得してくれる。
Assistant with Bardで利用できる機能はBardに基づいており、ユーザーがBard ExtensionsでオプトインしたアプリやサービスはAssistant with Bardでも利用できる。例えば、BardでGoogle WorkspaceのExtensionsを有効にしている場合、Googleアシスタントに「Catch me up on any important emails I've missed this week(今週の大切なメールで見逃しているものがあれば教えてください)」と頼むと、Gmailで今週受信したメールを見返して、未読の重要メールを提示してくれる。Bard Extensionsを利用することで、旅行やパーティの計画、ソーシャルメディア用のコンテンツの作成など様々な個人的なタスクにAssistant with Bardを活用できるようになる。
GoogleはBardの将来においてマルチモーダル性を重要視している。マルチモーダルとは、異なる種類のデータ(テキスト、音声、画像、ビデオなど)をAIが認識し、統合して情報を処理する能力を指す。Assistant with Bardでも、音声、テキスト、画像の3つを用いてGoogleアシスタントと対話できるようにする。例として、ペットを連れた山登りで、登山道の標識を前にどの登山道を選ぶべきか迷った際に、標識の写真を撮って「小型犬を連れたグループに適した登山道は?」と聞く。画像との組み合わせにより、テキストだけで質問するより簡単に質問でき、そしてビジュアルで多くの情報をBardに伝えられるので、より正確な回答を得られる可能性が高まる。
Assistant with Bardは初期の開発段階にあり、近日中に早期テスター向けのテストを開始する。続いて、数カ月以内を目処にオプトイン方式の提供に拡大し、Pixel 8シリーズのユーザーから展開する計画だ。