2025年12月16日、OpenAIは新しい画像生成AIモデル「ChatGPT Images(GPT-Image-1.5)」を正式にリリースしました。性能が向上しており、これまで多くのユーザーが感じていた「プロンプトによる指示出しの難しさ」や「編集時の意図しない変化」といった課題を解決してくれます。→過去の「柳谷智宣のAIトレンドインサイト」の回はこちらを参照。

バージョンが「GPT-Image-2」ではないのは、Google Geminiの猛追を受けて発せられたコード・レッドが原因かもしれません。11月20日にGoogleがリリースした画像生成AI「Nano Banana Pro(Gemini 3 Pro Image)」は、これまでにない描写力の高さで絶賛され、皆がこぞって画像を生成しています。このままでは、画像生成ならGoogle、と評価されてしまう可能性がありました。そのため、リリースを急いだのかもしれません。

今回は、注目の「GPT-Image-1.5」について解説し、実際にいろいろと画像を生成してみます。

  • 柳谷智宣のAIトレンドインサイト 第23回

    「GPT-Image-1.5」がリリースされ、ChatGPTに「画像」タブが追加されました

意図を汲んで正確に編集してくれる「GPT-Image-1.5」

ChatGPTやGeminiで画像を生成し、対話しながら画像を修正していくプロセスには課題がありました。例えば「右の人物の服だけを変えて」と頼んでも、生成される画像では背景の照明が変わってしまったり、人物の顔立ちが微妙に変化してしまったりすることが多かったためです。

GPT-Image-1.5は、ユーザーがアップロードした画像や生成した画像に対して、照明や構図、被写体の同一性を保ったまま、指定した要素だけをピンポイントで変更できる高度な編集能力を備えています。

例えば、ECサイトの商品画像を作成する際、モデルの顔やポーズを固定したまま、着ている服の色や柄だけを次々と変えていく「バーチャル試着」のようなコンテンツも、特別な機材なしで作成可能になります。

  • 柳谷智宣のAIトレンドインサイト 第23回

    「+」メニューから「画像」を選択し、プロンプトを入力します

試しに、Tシャツでバーベキューを楽しんでいる人物の服装をタキシードに変更してみましょう。プロンプトは「この人物の服装をタキシードにしてください」だけでOKです。

  • 柳谷智宣のAIトレンドインサイト 第23回

    Tシャツでバーベキューを楽しんでいる人物の画像

  • 柳谷智宣のAIトレンドインサイト 第23回

    服装だけを変更できました

また、この一貫性の維持は「スタイル」や「フィルター」の適用においても威力を発揮します。元の写真が持つ「エッセンス」を損なうことなく、全体を映画のポスター風にしたり、油絵調にしたりといった変換が可能です。従来のように、スタイル変換をかけた途端に元画像の面影がなくなってしまうようなことはありません。

  • 柳谷智宣のAIトレンドインサイト 第23回

    アニメ調にしてもらいました

  • 柳谷智宣のAIトレンドインサイト 第23回

    レオナルド・ダヴィンチ風にしてもらいました

創造性を加速させる「4倍速」の生成と直感的な新UI

今回のアップデートで嬉しいのが、生成速度の向上です。従来の画像生成モデルと比較してなんと最大4倍の速度で画像を生成します。待ち時間が長いと、作業のテンポが悪くなるので、早いに越したことはありません。実際に試してみても、速度の向上は体感できます。

また、ChatGPTのインタフェースに「画像」専用スペースが追加されました。

  • 柳谷智宣のAIトレンドインサイト 第23回

    「画像」メニューが追加されました。「真珠の耳飾りの少女になった私」をクリックしてみましょう

画像生成に特化したUIになっており、インスピレーションを刺激するプリセットのフィルターや、トレンドとなっているプロンプトが用意されており、自分でプロンプトを考えなくても、ワンクリックで高品質な画像を生成できます。

  • 柳谷智宣のAIトレンドインサイト 第23回

    ワンクリックで面白画像を生成できました

生成プロセスが並列化されたのも見逃せません。これまでは一つの画像が生成されるまで次の指示を出せずに待機する必要がありましたが、新しいインタフェースでは、画像生成のバックグラウンド処理が進んでいる間に、次のアイデアを試したり、別の画像を編集したりすることが可能です。

とはいえ、あまりに連続して生成していると、15分間待つように指示されるので注意しましょう。

  • 柳谷智宣のAIトレンドインサイト 第23回

    連続で画像を生成し続けたら、間隔をあけるように指示されました

複雑な構造の指示も正確に反映でき、価格改定によりビジネス導入が加速

GPT-Image-1.5はこれまで以上にプロンプトに忠実です。例えば「6行6列のグリッドを作り、1行目にはこれ、2行目にはこれ……」といった、構造的な指示に対しても、正確に生成できるようになりました。

以前は、列数が少なかったり、途中で指示していない画像が出たり、重複したりとうまくいかないことが多かったのです。教育用資料の作成や、ゲームのアセット制作、もしくはカタログのような整然としたレイアウトが求められる用途に活用できるでしょう。

  • プロンプト

    6列×6行の均等なグリッド(合計36マス)。白背景。各マスは正方形で、細い黒の罫線で区切る。各マスの中央にその犬種を象徴する全身イラストを1匹だけ描く(同じ画風・同じ線の太さ・同じ密度で統一)。余白は均一、見切れなし、全マスでサイズ感を揃える。ポスターのように整然、アイコン図鑑のように分かりやすい。
    1行目(左から):柴犬|秋田犬|甲斐犬|日本スピッツ|チワワ|トイプー
    2行目:プードル|ミニチュアS|ダックス|ポメ|パピヨン|ヨーキー
    3行目:マルチーズ|シーズー|ペキ|パグ|フレブル|ブルドッグ
    4行目:ビーグル|コーギー|シェルティ|コリー|ボーダーコリー|ラブ
    5行目:ゴールデン|シベハス|サモエド|Gシェパ|ドーベル|ロット
    6行目:セントバ|グレピレ|ダルメシアン|グレハ|ビション|キャバ
    スタイル:シンプルで可愛いフラットベクター、くっきりした輪郭線、やさしい陰影、色は自然で落ち着いたトーン。読みやすさ最優先。

  • 柳谷智宣のAIトレンドインサイト 第23回

    構造的な指示に対しても、正確に生成できるようになりました

開発者や企業向けにAPIも提供されます。価格は前モデルと比較して20%安くなり、導入のハードルが下がりました。

価格は100万トークンあたり、入力が5.00$(キャッシュ利用時は1.25$)、出力が10.00$です。また、画像トークンについては、入力が8.00$(キャッシュ利用時は2.00$)、出力が32.00$となっています。

ブランドにとって重要な「ロゴの一貫性」や「製品ディテールの維持」ができるようになったので、企業のマーケティング活動における生成AI利用が、テスト段階から実用段階へと移行し始めるかもしれません。

  • 柳谷智宣のAIトレンドインサイト 第23回

    APIも提供され、ビジネスでも活用しやすくなっています

画像生成AIの弱点として指摘されてきたのが、「文字(テキスト)の描写」です。GPT-Image-1.5はこの点においても進歩を遂げているのですが、英語に限るようです。日本語の描写は、前モデルよりはましになったものの、まだ文字化けするので実用レベルではありません。

AIの性能は高く、デザインやイラスト、図解などはきちんとできているので、なるはやで日本語のクオリティを上げてほしいところです。この点においては、Nano Banana Proに遠く及んでいません。

  • 柳谷智宣のAIトレンドインサイト 第23回

    本連載の記事を読み込ませて、解説画像を生成してみました。所々、漢字が変です

「GPT-Image-2」への布石か? 堅実な進化と今後の期待

今回、GPT-Image-1.5を使い倒してみて、OpenAIがクリエイターの実務的な課題を的確に解消してきたと感じました。生成スピードの高速化や、修正時の一貫性は、意図通りの作品を作り上げるツールとして活用できそうです。

しかし、Googleの「Nano Banana Pro」が高い壁として立ちはだかっているのも事実です。OpenAIもAPI価格を下げてきましたが、コストパフォーマンスや、我々日本のユーザーにとって重要な「日本語テキストの描写力」においては、現状ではNano Banana Proに軍配が上がります。

GPT-Image-1.5の登場には拍手を送りますが、Googleの勢いを覆すほどのインパクトには至っていない、というのが正直な感想です。今回のリリースは次世代モデルへの助走なのかもしれません。それほど時間を空けずに、「GPT-Image-2」が登場することを期待したいところです。