米Googleは3月25日(現地時間)、新AIモデル「Gemini 2.5」を発表した。思考プロセスを経て回答する論理思考型のAIモデルである。同シリーズの最初のリリースとして「Gemini 2.5 Pro Experimental」の提供を開始した。

Gemini 2.5は、マルチモーダル(テキスト、画像、音声など多様な情報を扱える能力)や長文コンテキストウィンドウ(一度に処理できる情報量)といった従来のGeminiモデルの強みを継承・強化しつつ、特に「推論(reasoning)」能力の向上に重点を置いて開発された。Google DeepMindのコーレイ・カヴュクチョロCTOは、「大幅に強化されたベースモデルと、学習後の調整(ポストトレーニング)の改善により、(Geminiは)新たな性能レベルを達成した」と述べている。

Gemini 2.5 Pro Experimentalは、25日より開発者向けの「Google AI Studio」と、有料プラン「Gemini Advanced」で利用可能となった。企業向けのAIプラットフォーム「Vertex AI」でも近日中に提供が開始される予定である。

Gemini 2.5 Pro Experimentalは、高度な推論能力が求められる様々なベンチマークにおいて、最高水準の結果を示している。数学や科学分野の難解なベンチマークである「GPQA」や「AIME 2025」でトップレベルのスコアを記録し、さらに「Humanity's Last Exam」で18.8%というスコアを記録した。Humanity's Last Exam(人類最後の試験)は、100以上の専門分野にまたがる問題を含み、推論力、読解力、論理的思考などを問う設計となっている。

プログラミング能力においても、Gemini 2.0から大きな進歩を見せており、AIによるソフトウェア開発能力を測る「SWE-Bench Verified」では、カスタムエージェント設定を用いた評価で63.8%という高いスコアを達成した。

Googleは、Gemini 2.5 Proが簡単な指示から、その推論能力を駆使して実行可能なコードを生成できる例として、下の動画を公開した。プロンプトは「魅力的なエンドレスランナーゲームを作ってください。画面上に主要な操作説明を表示。p5jsのシーンで、HTMLは使わないこと。ピクセル風の恐竜と面白い背景を私は好みます」だった。

現時点でGemini 2.5 Proは100万トークンのコンテキストウィンドウを備えており、近日中に200万トークンまで拡張される予定である。Googleは今後、論理思考能力をすべてのAIモデルに組み込み、より複雑な問題に対応し、文脈を理解して動作する高度なAIエージェントの開発をサポートしていく方針である。