米Googleは4月9日、AIモデル「Gemini 2.5」シリーズの最新ラインナップとして「Gemini 2.5 Flash」を発表した。スピードとコスト効率を重視して設計されたモデルで、開発者向けプラットフォーム「Vertex AI」で間もなく提供が開始され、「Google AI Studio」や「Gemini」アプリにも展開される。また、最上位モデル「Gemini 2.5 Pro Experimental」を用いたリサーチ支援機能「Deep Research」の提供も発表した。
近年、AIモデルの性能向上は著しいが、それに伴い運用コストが増加する傾向にある。企業向けアプリケーションにおいては、最高品質の応答性能よりも、応答速度やコスト効率が優先されるケースが少なくない。
Gemini 2.5 Flashは、大量のリクエストを処理するユースケースや、リアルタイム性が求められるタスクに最適化されている。Googleは、このモデルを「ワークホース(日々の業務を支える主力)」モデルと位置付け、「スケーラビリティと効率性が重要となる、応答性の高いバーチャルアシスタントやリアルタイム要約ツールに最適ななエンジン」としている。
Gemini 2.5 Flashの大きな特徴の1つが「動的かつ制御可能な推論 (dynamic and controllable reasoning)」機能である。AIが応答を生成する過程における「思考」プロセスを状況に応じて最適化する仕組みであり、モデルはプロンプトの複雑さを判断して処理時間(思考バジェット)を自動的に調整する。簡単な質問には思考時間を短縮して素早く回答し、複雑な質問にはより多くの時間をかけて応答品質を高める。これにより、無駄な計算リソースの消費を抑え、応答速度とコスト効率の向上を図ることができる。
さらに、開発者が用途に応じて思考バジェットを細かく制御することも可能である。これにより、コストを最優先するアプリケーションでは思考バジェットを抑え、精度が重要なタスクではバジェットを増やすといった柔軟な調整を行える。
一方、「Deep Research」は、ユーザーが指定したトピックについて、Geminiがインターネットなどを検索・分析し、構造化された詳細なレポートを自律的に作成する機能である。これまでも提供されていたが、Gemini 2.5 Proを基盤とすることで、その能力が大幅に向上する。
Googleによれば、同社が実施した評価者テストにおいて、Gemini 2.5 Pro ExperimentalによるDeep Researchは、他の主要なリサーチ支援ツールと比較して、2倍以上の差で好まれたという。指示への忠実さ、網羅性、完全性、文章品質といった点で高い評価を得たとしている。
強化されたDeep Research機能は「Gemini Advanced」を通じてWebとモバイル(Android、iOS)で提供される。利用するには、モデルを「2.5 Pro (Experimental)」に切り替え、プロンプトバーで「Deep Research」を選択する。