Googleは12月17日(米国時間)、高速性と手頃なコストが特徴のAIモデル「Gemini 3 Flash」を発表した。GeminiアプリやGoogle検索 AIモードのデフォルトモデルは、同日よりGemini 2.5 Flashから順次Gemini 3 Flashへ切り替わる。また、Google AI StudioおよびGemini API、Gemini CLIやAndroid Studioといった開発者ツールでもGemini 3 Flashが順次提供される。

  • Gemini 3 Flashが12月17日(米国時間)から順次提供される

    Gemini 3 Flashが12月17日(米国時間)から順次提供される

Pro並みの推論力とFlashの高速性を持つAIモデル

Gemini 3 Flashは、Flashシリーズの圧倒的なスピードを継承しつつ、Gemini 3 Pro並みの推論能力と低コストをうたうAIモデル。日常的なタスクの推論精度や、Gemini 3 Flashを活用したエージェントのワークフローでも高いパフォーマンスを発揮するという。

思考処理を行う際、ユーザーが用途に合わせてAIの思考の深さを柔軟に調整できる点も特徴。複雑なユースケースでは時間をかけて推論し、日常的なタスクではGemini 2.5 Proより平均30%少ないトークン消費量で高いパフォーマンスと高精度な処理を行うとする。

博士号レベルの推論や知識に関するベンチマーク「GPQA Diamond」で90.4%、「Humanity’s Last Exam」で33.7%と高いパフォーマンスを示し、マルチモーダルAIの理解力/推論力を評価する「MMMU Pro」でも、Gemini 3 Proと並ぶ81.2%というスコアを記録した(Gemini 3 Proのスコアは81.0%)。

  • 各種ベンチマークにおけるGemini 3 Flashのスコア

    各種ベンチマークにおけるGemini 3 Flashのスコア

コストはGemini 3 Proの約4分の1に

コストについてはGemini 3 Proの約4分の1となる、入力100万トークンあたり0.50ドル、出力100万トークンあたり3ドルを実現。音声入力は入力100万トークンあたり1ドルのまま据え置く。

Gemini 3 FlashはGeminiアプリやGoogle検索 AIモードのデフォルトモデルとして順次提供を開始。質問の細かなニュアンスを汲み取る能力が強化され、Web上のリアルタイム情報やリンクを引用しながら、わかりやすい回答を提示する。

Googleでは「検索ならではのスピード感で、知的かつ整理された分析結果と、具体的な推奨事項をセットで受け取ることができる」と紹介している。