特定の目標を達成するために環境を認識し、自身の判断で自律的に行動するAIエージェント。生成AIと連携すると"これこれをやって"で表示するだけではなく、実際の環境を操作してくれるために生成AIとは別次元のエクスペリエンスになる。

たとえば、身近なところではスケジュール。カレンダーに毎週決まったタスクがある場合に、これを手動で一定期間に設定するのは大変だ。3カ月設定する場合には、10回以上にわたり日付を選択し、クリックして時間を指定して、「会議」と件名を入力して、OKという所作を繰り返すことになる。楽しくはないだろう。

これが自律的なAIエージェントでは、

 カレンダーに6月、7月、8月の期間の毎週、月曜日の17時に会議を設定

のみで実際のGoogleカレンダーに登録される。シンプルだが、従来の所作と比較すると圧倒的に速くなるし、とてつもなく心地よい。Googleカレンダーの場合、Geminiの設定でGoogle Workspaceとの連携にチェックを入れるだけだ。

  • "カレンダーに6月、7月、8月の期間の毎週、月曜日の17時に会議を設定"で毎週Googleカレンダーに登録される会議。

  • Geminiの設定画面でGoogle Workspaceとの連携にチェック

Microsoft 365 Copilotでも既報のようにCopilot StudioによるAIエージェント化をいっそう進める構えだ。同社のCharles Lamanna氏が「人がアプリを使えるなら、エージェントも使えます」と述べるようにGUI(グラフィカルユーザーインタフェース)を持つデスクトップアプリケーションにCopilot Studioの幅が広がる。

  • early access research previewでテスターに提供されているCopilot Studioの"computer use"(同社公式ブログより)

Microsoftは、昨年9月にWindows OS環境でのAIエージェント開発のためのフレームワーク「Windows Agent Arena」をオープンソースで公開(GitHub)している。Windows内でのアプリケーション操作やシステムタスク、ユーティリティ操作など150を超える多様なタスクをLLM(大規模言語モデル)を使って行動できるAIエージェントのテスト環境だ。

  • 「Windows Agent Arena」

このような自律的なAIエージェントがいたるところにある世界。意味のない繰り返しや業務上の何かを探すために何日もかかるようなことから解放されると時間が節約され、本質的なタスクに入念できるようになる。自然言語を魔法の呪文のように扱えるハリーポッターのような世界は案外近いのかもしれない。楽しいに違いない。

この記事は
Members+会員の方のみ御覧いただけます

ログイン/無料会員登録

会員サービスの詳細はこちら