現段階での各社AIについてはどんどん進化を続けていて、何がベストのサービスなのかを断定するのが難しい。日常的な性能向上はもちろんだが、AIモデルのメジャーバージョンアップなどがあった場合は、昨日までの既存のサービスとは段違いの性能を発揮する。だから、今は、A社のAIが最高だと判断できていても、それがいつB社にひっくり返されるのかわからない。そして、ひっくり返ったかと思ったら、またキャッチアップされてしまうようなプロセスが繰り返されている。これこそが競争というもので、その結果、われわれエンドユーザーは最高性能のAIをリーズナブルな価格で利用できるという恩恵が得られている。
直近の動きとしては、GoogleがGeminiを刷新し、3.5 Flashの提供を開始した。これまでは3.1だったので、ステップがいくつか進んだことになる。この新バージョンがなかなかいい。これまでのGeminiはハルシネーションが目立ち、平然と誤情報を返すケースに閉口することもあったが、今回は、そうでもなさそうだ。とはいえ油断はできない。生成結果を鵜呑みにせず、慎重に使うように心がけていく。公式発表ではないのだが、試してみたところ、1時間を超えるような長尺の音声ファイルを普通に文字起こしできるようになったのはうれしい。これまでは30分程度でハルシネーションを起こしていた。多くのAIレコーダーは、一か月に300分までを無償で文字起こしできるサービスとして提供しているが、その世界がレッドオーシャンになりかねない。音声文字起こしサービスにとっては、競争環境の激化を意味する点で気になるところでもある。
AIとの会話でのウソを見抜くのはそんなに難しいことではない。特に、自分の専門分野に対する調べものをするために会話で質問したりした結果については、すぐにウソを発見できる。つまり、その分野に精通しているユーザーが、自分でもやれるけれど、作業量が膨大でめんどうくさいことをやってもらう場合、AIの作業結果が正しいかどうかは容易に判別できるが、専門分野ではない場合には、ウソを見破るのがそれなりにたいへんだ。だからこそ、作業結果は、それが正しいかどうかを何度も尋ね、場合によっては他のAIの生成結果と比べたりもする。今、AIエージェントがトレンドだというのはとてもよくわかる。もはや乱立するAIモデルを、得意分野ごとに使い分けるのは、一般のユーザーには不可能だといってもいい。だからこそ、複数のAIを横断して検証するAIエージェントへの期待が高まっている。
個人的には、とにかく何から何までAIに尋ねるようになってしまっている。メインに使っているのはGoogleのGeminiだが、その日の夕食のレシピのようなことでも提案させる。
今、Geminiを使うにはGeminiのサービスサイトで対話する方法とGoogleの検索ページで対話する方法がある。Google AI Studioなどを使って高度なことをする方法もあるが、カジュアルなAIへの利用についてはこの2種類だ。他にも音声や映像共有で対話ができるGoogle Liveがスマホ用に提供されている。これを使えば日本語での自然な対話でいろんな質問ができる。冷蔵庫の中をGeminiに見せて、献立を提案してもらうといったことも容易だ。
それらに加えて、最近になって「Geminiに相談」という方法が加わった。Windowsなら、Chromeブラウザのタイトルバーにボタンが表示され、それをクリックするとサイドパネルが開き、今、ブラウザが表示している内容についてのいろんな質問ができる。
歓迎したいのはここでの対話がGeminiとの対話としてちゃんと残ってくれる点だ。検索のトップページで検索ボックスから始めたAIとの対話は、それだけが別カテゴリとして残るようになっていた。それはそれで便利なのだが、どのインターフェイスで対話したのか分からなくなり、Geminiとの会話履歴をたどっても見つからなくて途方に暮れていたら、実は、検索ページでの対話だったということがよくある。
どっちにしても、あらゆることをGeminiに尋ねるようになると、対話履歴の検索がとてもやっかいになる。履歴はカテゴリ別にフォルダに分類できるわけでもないし、検索のトップページでの質問は別枠だったりする。また、Gemini Liveでの会話を含めればもっとややこしくなる。贅沢な要望かもしれないが、会話の履歴検索については、もうちょっとわかりやすくならないものかなと思う。
対話検索の最終手段はGeminiのメニューにある「アクティビティ」を使えばいい。ここで、Geminiとの対話について、それをすべて記録する機能をオン/オフできる。これをオンにしておけば、いろんなGeminiとの対話を対象として検索ができる。この機能を使えば会話が迷子になったりすることは少なくなるはずだ。検索ページでの対話も含めて、あらゆるやりとりがタイムライン上で網羅できる。
どっちにしても検索しにくいことは確かなのだが、そこはそこ、Geminiに尋ねると、大事な会話は共有リンクを生成して、別の会話の先頭に貼り付けるなどして、過去を振り返るトリガーにするといいと提案してくれた。自動生成されたものではなく、自分できちんとタイトルをつけるというのもいい。とにかくぶっきらぼうにならず、きちんとした言葉で聞きたいことを正確に伝えるということが、正しい答えを得るための早道だし、将来にわたって、過去のやりとりを探し出すときにも役にたつ。
そしてもうひとつ新しいチャットを開始するときに、「一時チャットをオンにする」を指示すれば履歴は何も残らない。会話履歴をシンプルにするには役立つかもしれない。ただし、安全のために72時間はシステムに保持される仕組みになっている。
