米Googleは2月5日(現地時間)、最新のAIモデルファミリーであるGemini 2.0の以下のようなアップデートを発表した。
- 1月30日にGeminiアプリへの展開が始まった「Gemini 2.0 Flash」が一般提供(GA)となり、GoogleのAI製品全体で利用可能となった。
- 最上位モデル「Gemini 2.0 Pro」のExperimental(実験的)提供を開始。
- 「Gemini 2.0 Flash-Lite」を発表、パブリックプレビューを開始。
- 思考型AIモデル「Gemini 2.0 Flash Thinking Experimental」のGeminiアプリへの展開を開始。
「Gemini 2.0 Flash」は、高頻度で大量のタスクを処理するのに最適なワークホースモデルである。低遅延の応答を提供する軽量版でありながら、Gemini 1.5 Proを上回る性能を発揮する。100万トークンのコンテキストウィンドウを備え、膨大な情報量を処理しながら、マルチモーダル推論を効率的に行うことが可能である。画像や音声の生成機能も近日中に追加される予定。
「Gemini 2.0 Pro Experimental」は、Gemini 2.0ファミリーの中で最も優れたコーディング性能と複雑なプロンプト処理能力を持つ。一般知識の理解と推論能力も向上しており、200万トークンのコンテキストウィンドウを備えることで、大量の情報を包括的に分析・理解できる。さらに、Google検索やコード実行といったツールの呼び出しにも対応する。Google AI StudioおよびVertex AIで開発者向けに提供されるほか、Gemini Advancedユーザーはデスクトップおよびモバイルで利用可能である。
「Gemini 2.0 Flash-Lite」は、Gemini 1.5 Flashよりも高品質でありながら、同じスピードとコストを実現する。Gemini 2.0ファミリーで最もコスト効率の高いモデルであり、100万トークンのコンテキストウィンドウとマルチモーダル入力を備える。例えば、Google AI Studioの有料版では、1ドル未満のコストで約40,000枚の写真のキャプションを生成できる。Google AI StudioおよびVertex AIにおいて、パブリックプレビューとして提供される。
「Gemini 2.0 Flash Thinking Experimental」は、より深く考え、推論を強化するようにトレーニングされており、より複雑な問題への対応が可能。思考プロセスが可視化され、AIモデルの推論とコンテンツ生成の過程をユーザーが辿れる点も特徴である。
Gemini 2.0 Flash Thinking Experimentalは、YouTube、検索、Googleマップなどのアプリと連動できるバージョンと共に、 Geminiアプリ(WEB、モバイル)に展開されている。