Googleは11月20日、画像生成および編集モデルでGemini 3 Proを基盤とする「Nano Banana Pro」を公開した。
「Nano Banana Pro」の概要
Nano Banana Proは、プロトタイプの作成、データからのインフォグラフィック作成、手描きのスケッチの図表化など、あらゆるアイデアを視覚化し、デザインする作業を支援。Gemini 3の推論能力により、画像を生成するだけでなく、新しい科目について学ぶ際に役立つ図解や、事実や文脈に基づいたインフォグラフィックや図表なども生成できる。さらに、Google 検索の知識ベースとも連携し、簡単なレシピや天気、スポーツなどリアルタイム情報の可視化にも対応する。
また、短いキャッチコピーから長文まで正確にレンダリングし、読みやすいテキストを画像内に直接作成でき、ポスターやモックアップにおける細かなテキスト表現や、多彩な質感、フォント、カリグラフィ表現にも対応。多言語推論が強化され、複数の言語でのテキスト生成、コンテンツのローカライズ、翻訳も可能になり、複数国間や文化間での展開や、家族や友人とのコンテンツ共有も簡単になるという。
さらに、最大14枚の画像を組み合わせて、最大5人までの人物の特徴や類似性を維持したまま画像生成が可能なほか、スケッチから製品画像にしたり、設計図を写真のような3D構造にしたりすることができる。ブランドのトーンとマナーに合わせたビジュアルをモックアップに簡単に適用を可能としている。
加えて、高度なクリエイティブ機能を搭載し、改善されたローカライズ編集機能で画像内の任意の部分を選択、調整、変換できることに加え、カメラアングルの調整、フォーカス変更、カラーグレーディングの適用、昼から夜への変更、ボケ効果の作成など、シーンライティング調整も可能。ソーシャルメディアから印刷物まで、さまざまなプラットフォームに対応できるアスペクト比と、2Kや4Kの解像度にも対応。
利用については、一般ユーザーおよび学生向けはGeminiアプリで「画像の作成」を選択し、「思考モード」を選ぶと利用できる。無料ユーザーには限定的な無料クレジットが提供され、その後はNano Bananaに切り替わる。Google AI Plus、Pro、Ultraユーザーは多くのクレジットの利用が可能で、米国のGoogle AI Pro、Ultraユーザーを対象にGoogle 検索のAIモードでも利用できる。NotebookLMでは、世界中のユーザーが利用可能。
プロフェッショナルは、Google 広告での画像生成がNano Banana Proにアップグレードされ、世界中の広告主がクリエイティブ制作・編集でき、Google Workspace ユーザーはGoogle スライドとGoogle Vidsで11月20日から利用できる。
開発者および企業向けはGemini APIとGoogle AI Studio、Google AntigravityでリッチなUXレイアウトやモックアップを作成でき、企業ユーザーはVertex AIで生成ワークフローを11月20から構築可能でGemini Enterpriseでも近日提供を予定。クリエイター向けでは、Google AI Ultra ユーザーはAI映像制作ツール「Flow」で利用できる。
