Googleは2月5日(米国時間)、同社のAIモデルファミリー「Gemini 2.0」のモデルのうち、Gemini 2.0 FlashのGoogle AI Studio/Vertex AIのGemini APIを通じての提供を開始したとアナウンスした。またあわせて、Gemini 2.0 Proの試験運用版の公開、低コストモデルGemini 2.0 Flash-Liteの発表も行った。
Gemini 2.0は2024年12月に公開されたGeminiの最新モデルファミリー。同時にそのモデルのひとつであるGemini 2.0 Flashの試験運用版が公開されており、1月30日には「Gemini」アプリで利用可能となっていた。
今回のGemini 2.0 Flashについてのアナウンスは、その試験運用版に寄せられたフィードバックに基づいて更新された正式版の提供を開始するというもの。Google AI Studio/Vertex AIのGemini APIで同モデルが提供されることで、開発者はGemini 2.0 Flashの正式版を利用したアプリケーションの開発が行えるようになる。詳細な情報は開発者向けブログや「Gemini」アプリを通じて入手できる。
Gemini 2.0 Proは、Gemini 2.0モデルファミリーの最上位に位置づけられる、優れたコーディング性能と複雑なリクエストへの対応に特化したモデル。試験運用版はGoogle AI Studio/Vertex AIの開発者とGemini Advancedユーザー向けに提供され、モデルの選択画面から利用できるようになる。
Gemini 2.0 Flash-Liteは、Gemini Flash 1.5のコストと速度を維持しつつ品質の向上を図って用意されたモデル。Gemini Flash 1.5と同等の速度/コストで、それを上回る性能を示すという。例を挙げると、Google AI Studioの有料プランでは、1ドル未満のコストで約4万枚の写真に対してそれぞれ1行の適切なキャプションを生成できるとのこと。このGemini 2.0 Flash-Liteも、Google AI Studio/Vertex AIで公開プレビューとして利用できる。
試験運用版であるGemini 2.0 Proを除き、Gemini 2.0 Flash/Gemini 2.0 Flash-LiteについてはAPI利用のコストも公開されている。Gemini 1.5 Flashであったようなトークンのボリュームによる区別はなく、以下のようになる(Gemini 1.5 Flashのコストも比較のため記載)。
モデル | 2.0 Flash | 2.0 Flash-Lite | 1.5 Flash |
---|---|---|---|
テキスト/画像/ビデオ入力 | 0.10ドル | 0.075ドル | 0.075ドル(128,000トークンまで)/0.15ドル(128,000トークン以上) |
音声入力 | 0.70ドル | ||
テキスト出力 | 0.40ドル | 0.30ドル | 0.30ドル(128,000トークンまで)/0.60ドル(128,000トークン以上) |
コンテキストキャッシング | 0.025ドル(テキスト/画像/ビデオ)/0.175ドル(オーディオ) | 0.01875ドル | 0.01875ドル(128,000トークンまで)/0.0375ドル(128,000トークン以上) |