生成AIが脳波ではなく文字や文章など自然言語でやりとりする以上、プロンプトの重要性は変わらない。Googleは、公式ブログにおいて"究極のNano Bananaプロンプトガイド"(The ultimate Nano Banana prompting guide)と題した指南を載せている。Nano Banana 2とNano Banana Proをユースケースを数週間かけてテストした結果から効果的なプロンプトのベストプラクティスは、
- 具体的に記述する(主題、照明、構図に関する具体的な詳細)
- 肯定的な表現を使う(望まないものではなく、望むものを説明)
- カメラを操作する(「ローアングル」や「空中ビュー」などの写真用語や映画用語を使用)
- 反復(会話形式で追加プロンプトで画像を調整)
-
また、実際のプロンプトを生成、編集、ウェブ検索からのリアルタイム情報、テキストレンダリングとローカリゼーション、クリエイティブディレクターのように促すの5つのフレームワークで紹介。何も参照せずにプロンプトのみでの純粋な生成の一例としては
公式 [Subject(主題)] + [Action(行動)] + [Location/context(場所/コンテキスト)] + [Composition(構図)] + [Style(スタイル)]
これを実践する例が以下のようなプロンプトになる。
[Subject] 仕立ての良い茶色のドレスと洗練されたブーツを身につけ、立体的なハンドバッグを持った印象的なファッションモデル。[[Action]] 自信に満ちた彫像のような姿勢で、少し体を傾けながらポーズを取っている。[Location/context] シームレスで深みのあるチェリーレッドのスタジオ背景。[Composition] 中央にフレームを置いた、ミディアムフルショット。[Style] ファッション雑誌風のエディトリアル。中判アナログフィルムで撮影。粒状感が強く、彩度が高く、映画のような照明効果。
先のベストプラクティスを実践しているが、カメラに詳しくないと出てこないほど具体的なキーワードで指示するものだ。調べてみると中判アナログフィルムは、写真を大きく引き伸ばしたときに画質の劣化が少なく"美しいボケ味"が魅力のひとつとのこと。フィルムの銀粒子がランダムに配置されることで境界線がやわらかく美しい質感を出せるという。公式ブログには、同プロンプトで生成した実際の写真も掲載してある。
-

Google公式ブログより
たしかに、ベストプラクティスにあるようにアナログでも特長のある絵を描くには「構図」が重要だ。フラットな絵と遠近法を駆使した絵では、まったく異なる完成になるのは想像に難くない。クローズショットやワイドショット、アップショットにダッチアングル(カメラを斜めに傾ける)と調べてみると映像や写真の世界の専門用語はやはり豊富なもの。実際のカメラや映像の世界の知識を深めながら、自分なりの生成AIプロンプトを見つけ出すのもスキル上達には必要な視点だ。