待望の最新AIモデル「Gemini 2.5 Pro Experimental」がお目見え! - 驚きの実力 - 柳谷智宣のAIトレンドインサイト(7)

2025年3月26日、Googleが次世代推論AI「Gemini 2.5」シリーズを発表し、同時にマルチモーダルAI「Gemini 2.5 Pro Experimental」がリリースされました。Gemini 2.5は、より複雑な問題に取り組むために設計された推論型のAIモデルで、高い推論力とコード生成能力を備えているのが特徴です。

多くのベンチマークで圧倒的なスコアを叩き出したGemini 2.5 Pro Experimental

現在、Gemini AdvancedとGoogle AI Studioで利用できます。筆者はGoogle Workspaceユーザーですが、GeminiのAIモデルメニューから切り替えることで利用できました。

今のところ、無料プランでは1日50リクエストまで、1分当たりのリクエスト数は2回/分とのことです。また、ナレッジカットオフ日が2025年1月と新しいのもポイントです。

「Gemini 2.5 Pro Experimental」がリリースされました

Gemini 2.5 Pro Experimental(以下、EXP)は、数多くのベンチマークテストにおいて圧倒的なスコアを叩き出し、Chatbot Arenaでは他のモデルを上回る評価を獲得。特に、数理問題や科学的課題、そして人間の知識の限界を試す「Humanity's Last Exam」といった高度な評価基準において、優れた推論能力を発揮しています。

Googleの発表によれば、ほとんどのテストでOpenAI o3-miniやGPT-4.5、Claude 3.7 Sonnet Extended、Grok 3 Beta、DeepSeek R1のスコアを超えているそうです。

高いベンチマークスコアを出しているGemini 2.5 Pro Experimental

Gemini 2.5 Proは、コード生成や編集においても大きな進化を遂げており、ウェブアプリケーションやエージェント型コードアプリケーションの作成においても優れた性能を持っています。

SWE-Bench Verifiedといった業界標準の評価テストでは、カスタムエージェントのセットアップにおいても高いスコアを記録し、シングルラインのプロンプトから実行可能なビデオゲームのコードを生成するなど、その応用範囲の広さが伺えます。以下の動画は1文のプロンプトからプレイできるゲームを生成するデモです。

Gemini 2.5はマルチモーダルなデータ処理能力や、従来のモデルを凌駕する大容量のコンテキストウィンドウを備えています。今のところは従来と同じ100万トークンですが、今後200万トークンになる予定です。

テキストや音声、画像、動画、さらにはコードリポジトリといった多様な情報源を統合し、複雑な問題に対応することができます。

大学入試チェック

では、早速試してみましょう。2025年の東京大学第2次試験問題からベクトルの問題です。

プロンプト

東京大学理系数学 2025 大問1

座標平面上の点 A(0,0),B(0,1),C(1,1),D(1,0)を考える。実数0<t<に対して、線分AB,BC,CDをt:(1-t)に内分する点をそれぞれP_t,Q_t,R_tとし、線分P_tQ_t,Q_tR_tをt:(1-t)に内分する点をそれぞれS_t,T_tとする。さらに、線分S_tT_tをt:(1-t)に内分する点をU_tとする。また、点AをU₀,点DをU₁とする。

(1)点U_tの座標を求めよ。

(2)tが0≦t≦の範囲を動く時に、点U_tが描く曲線と、線分ADで囲まれた部分の面積を求めよ。

(3)aを0<a<1を満たす実数とする。tが0≦t≦aの範囲を動く時に点U_tが描く曲線の長さを、aの多項式の形で求めよ。