米Googleは11月20日（現地時間）、画像生成AIモデル「Nano Banana Pro（Gemini 3 Pro Image）」を発表し、プレビュー版の提供を開始した。

Nano Banana Proは、同社が18日にリリースした最新の大規模言語モデル「Gemini 3」を基盤とする画像生成モデルである。従来モデルと比較して、画質、テキストの再現性、編集の柔軟性が向上し、プロのクリエイターやデザイナーが求める「制御性」と「高画質」を備えたとしている。

Gemini 3は、長文の指示や複数の条件を含むプロンプトでも文脈を踏まえて解釈し、「誰が」「何を」「どのようなスタイルで」「どのメディア向けに」といった要素を整理して画像生成に反映できる。

従来の生成AIでは、ユーザーが指定した構図や細部を正確に再現できない場合があった。Nano Banana Proでは、カメラのアングル、照明の当たり方、被写界深度、カラーグレーディング（色調補正）といった、写真撮影や映像制作で重要となる要素を、言葉による指示で細かく制御できるようになった。

解像度は最大4K（4096×4096）をサポートし、幅広いアスペクト比に対応する。細かな文字や背景のディテールをより精細に描写でき、Web素材だけでなく印刷物や高精細広告クリエイティブにも適した出力が可能となる。

Gemini 3の深い推論能力は、データのインフォグラフィック化や手書きメモの図表化など、情報やアイデアの視覚化にも活かされる。

デザインの一貫性を保つ能力も向上しており、Googleによれば、Nano Banana Proは1つの画像に最大14個の標準オブジェクトを配置できる。人物についても、最大5人の顔立ちや特徴の一貫性を維持したまま、構図や服装を変えた画像生成が可能である。マーケティング素材で同一人物を複数シーンで使う場合や、設計図をフォトリアリスティックな3D構造物に変換する用途、コミック風コンテンツの制作など、多様な活用が想定される。

従来の画像生成AIには、看板や吹き出しなどに文字を含めると形が崩れやすい課題があった。Nano Banana Proではこの点が改善され、メニューやポスター、インフォグラフィックなどに読みやすい文字を自然に埋め込めるようになった。スタイルやフォントも柔軟に変更でき、画像内のラベルや看板を別言語に置き換えるローカライズ用途にも対応する。

Nano Banana Proのもう1つの大きな強化点として、Google検索と連携する「グラウンディング（Grounding）」機能がある。生成AIが事実と異なる情報を出力する「ハルシネーション」の課題に対し、Google検索を通じてリアルタイムのWeb情報を参照しながら生成が行えるため、たとえば「最新の自転車メンテナンス手順のインフォグラフィック」を正確な手順に基づいて作成できる。生物学の図解や歴史地図など、正確性が求められる分野での活用が期待される。

Nano Banana Proを今すぐ試す方法

一般ユーザー向けには「Gemini」アプリでの展開が開始されており、「Thinking（思考モード）」を選択すると、Nano Banana Proによる「画像を作成」を行える。ただし、利用数に上限があり、それを超えると従来モデル（Nano Banana）へ自動的に切り替わる。Google AI Plus、Pro、Ultra各プランでは、より多くの割り当てが提供される。AIリサーチツール「NotebookLM」、 AI映像制作ツール「Flow」、「Googleスライド」や「Google Vids」など他のサービスでも順次対応が進められる。

プロフェッショナルおよび企業向けに、開発者向けプラットフォーム「Google AI Studio」や「Vertex AI」、新開発環境「Antigravity」での提供が開始された。AdobeやFigmaといった主要なクリエイティブツールとの統合も進められている。

「gemini-3-pro-image-preview 」（Nano Banana Pro） のGemini APIの料金は以下の通り：

1080p/2K（2048×2048）解像度：1120 トークンを消費、画像1枚あたり 0.134ドル

4K（4096×4096）解像度： 2000トークンを消費、画像1枚あたり 0.24ドル

「gemini-2.5-flash-image」 （Nano Banana）の料金は、1024×1024ピクセルで画像1枚あたり0.039ドルである。高解像度・高品質な生成には処理コストが増えるため、大量生成には従来モデルのNano Banana、品質重視の場面ではNano Banana Proという使い分けが有効になる。