Copilot in WindowsはOpenAIのDALL・E 3を使った画像の生成が可能であることを取り上げた。言葉で指示するだけで画像の生成や書き換えが可能であり、使いこなせれば強力なツールになる。しかし一方で、思い描いているとおりの画像を生成させるのは至難であることも説明した。今回はこうした特性を踏まえつつ、前回までに取り組んできたロゴの作成を通じて自分の意図する画像を描かせるためのいくつかのTIPSを紹介する。

連載「Copilot in Windowsを使ってみよう」のこれまでの回はこちらを参照

ある程度の方向性をコントロールすることはできる

Copilot in Windowsで画像を生成する場合、こちらが明確に意図している編集を行わせることはかなり難しい。DALL・E 3による画像の生成はそうした指示による画像の生成を可能にするものではなく、創造的な画像生成を実現するためのものという側面が強いからだ。

しかしながら、ある程度生成される画像の方向性をコントロールすることはできる。あくまでも「ある程度」でしかないのだが、まったく画像を生成するスキルを持っていないのであれば、こうしたコントロールだけでも自分が使いたいと考える画像を生成する際に役立つはずだ。今回はそうした方法のいくつかを取り上げる。

TIPS1. 細かく指定する

最初に最も大切なことは、自分が描いているイメージを可能な限り詳細な文章として書き、指示することだ。詳しく指定するというのは、相手がCopilotではなく人間だったとしても同じことだろう。自分のイメージを伝えもしないで「よろしく頼む」とだけ言ってもまるで違う成果物ができてくるのは間違いなく、それに対して変更指示を出すというのは、発注する側も、受注する側も不幸になるだけだ。まずは要望を可能な限り詳しく伝えるというのが基本中の基本になる。

例えば、ここでは前回までに行っていた最初の指示に、さらに次のように「時計」と「ミミズク」というイメージを追加した説明を行うようにする。

現在開発部で業務の残業時間管理システムとして「時間守護」と呼ばれるシステムを開発しています。残業が特定の従業員に偏らずにだいたいどの従業員にも同じように残業の割当ができるような管理システムです。このシステムの開発に合わせて、システムのロゴを作成する必要があります。残業時間管理システム「時間守護」に合うかっこいいロゴをいくつか提案してください。ロゴには、残業時間をイメージさせるために「時計」を、業務管理をイメージさせるために「見守る」という意味で「ミミズク」を含めてください。また、小さいサイズでも判別がつくようにシンプルなデザインにしてください。

会話スタイルを「より厳密に」に設定し、上記指示を入力すると次のような画像が生成された。

  • 「時計」と「ミミズク」を使った「時間守護」システムのロゴを生成するように指示

    「時計」と「ミミズク」を使った「時間守護」システムのロゴを生成するように指示

これまではさまざまなロゴ案が生成されていたが、「時計」と「ミミズク」という指定を行ったことで、ロゴの方向性がより明確になっていることが分かる。

ただし、この生成ではロゴのデザインをシンプルにするという指示は無視されている。シンプルという指示が不明確だった可能性があり、さらに突っ込んだ説明が必要だったことが見えてくる。

そこで次は「シンプルなデザイン」という指示に加えて、「立体感をなくして平面化するとともに」という指示を追加してみる。可能な限り具体的な指示を行っていくことがポイントだ。ここでは次のような指示を行っている。

とてもいい感じです。ただ、ロゴとして使うには複雑すぎです。立体感をなくして平面化するとともに、さらにシンプルなデザインにしてください。さらに背景は白にしてください。

  • 立体感をなくして平面化しつつさらにシンプルにするように指示

    立体感をなくして平面化しつつさらにシンプルにするように指示

生成されたロゴは上記のとおりだ。最初に指示した内容は維持しつつ、よりフラットでロゴとして扱いやすいデザインになっていることが分かる。

TIPS2. スレッドを切る

Copilotはスレッドでの会話の流れを加味して会話をしていると考えられる。このため、新しい画像生成の指示を出しても、それまでの文脈を含めた編集が行われているような動きを見せる。そこで、画像の編集を意図通りに進めたい場合にはその都度右上の「↻」アイコンをクリックしてスレッドを切り、新しく会話を始めることもポイントになる。

仮に、先ほど生成された画像のうち、次のロゴが比較的イメージに近いものだったとする。

  • この画像がイメージに近いとする

    この画像がイメージに近いとする

この画像をダウンロードしたら、Copilot in Windowsの右上の「↻」アイコンをクリックしてスレッドを新しく切って、ダウンロードした画像をアップロードし、その画像に対する編集を指示する。ここでは次のようにカラーを白黒にし、背景を白にするように指示する。

このロゴを白黒に書き換えてください。背景は白にしてください。

実行すると次のようなロゴが生成される。

  • ロゴを白黒に変更するように指示

    ロゴを白黒に変更するように指示

イメージが白黒になったことを確認できる。

TIPS3. 一部の編集はできないことを知る

先ほどの生成されが白黒のロゴを見てみよう。背景を白にして、画像を白黒にするように指示を出しただけだが、ロゴ自体のデザインがずいぶん変わっていることが分かる。指定した画像をベースにして新しく4つのデザインが生成されている。これがDALL・E 3の特徴のひとつで、一部の編集だけを行うような指示は理解されないことが多く、常に新しいものが生成されてしまうことを知っておこう。画像は新しく生成されることを前提にして指示を出すように思考する必要があるのだ。

TIPS4. 正確な描画はできないことを知る

DALL・E 3は「それらしい」画像を生成するのを得意としており、正確な画像を生成することは不得意にしていることを理解する必要がある。例えば次のロゴイメージだが、時計の部分のラベルがおかしなことになっている。時計がこれではかなり困ったことになる。ちゃんとした時刻のラベルになっていないのだ。

  • 時計のラベルが不正確

    時計のラベルが不正確

人間であればこれは時計であると認識しているので、なんらかの意図がある場合を除いて、基本的に時計のラベルは正確に書くことがほとんどだと考えられる。しかし、DALL・E 3はそういった仕組みになっていないので生成されるラベル部分がいつのまにか「それらしく」なってしまい、不正確なレンダリングになっていく。

TIPS5. 生成される画像は常に創造的になりがちなことを知る

先ほど生成されたロゴの中では次の画像ならロゴとして使えそうにみえる。時計のラベルが記号なのでこれなら問題ないからだ。

  • 問題なくロゴに使えそうなイメージ

    問題なくロゴに使えそうなイメージ

このロゴに「TIME GUARDIAN」という文字列を加えて完成としたいので、次のような指示をしてみる。再度スレッドを新しく切ってから指示を行う。

このロゴに「TIME GUARDIAN」という文字列を追加してください。

  • ロゴに「TIME GUARDIAN」という文字列を加えるように指示

    ロゴに「TIME GUARDIAN」という文字列を加えるように指示

せっかく白黒になったのに、またロゴがカラーに戻ってしまった。よく言えばDALL・E 3は常に創造的な方向に画像を生成しようとするので、指示の内容が少ないとすぐに新しい画像を生成してしまう。

想定通りにいかなかったので、ここで再度スレッドを切り、今度は次のようにロゴの位置の指定や、ロゴそのものは書き換えないように指示を行う。

このロゴの下部に「TIME GUARDIAN」という文字列を追加してください。ロゴはなるべく現状のままにしてください。

  • ロゴの下部に「TIME GUARDIAN」という文字列を追加し、かつ、ロゴはなるべくそのままにするように指示

    ロゴの下部に「TIME GUARDIAN」という文字列を追加し、かつ、ロゴはなるべくそのままにするように指示

先ほどよりはイメージに近いが、「ロゴはなるべく現状のまま」という指定はこちらの考えているものとはかなり違った受け取り方をされたことが分かる。常に創造的な画像を生成しがちだ。

今回の落としどころはこのあたり

今回のロゴ生成の落としどころとしては、次の画像が生成された段階でロゴ案は良しということにして、そこから後の「TIME GUARDIAN」の文字列の追加は画像編集アプリケーションを使うとか、文字列のみをCopilot in Windowsで生成して、それを画像編集アプリケーションで追加するといった操作を行うといったことになる。

  • よさげな時点でのロゴ

    良さげな時点でのロゴ

ただし、今回取り上げてきたロゴの作成は、これまでに取り上げてきた手順と比べると一番方向性がコントロールされたものになっていることが分かると思う。このようにある程度説明を細かくしたりスレッドを切ったりし、繰り返し生成させることである程度の方向性を制御することはできる。あとは納得できるところまでこの手順で対話を繰り返すというのが主な作業になってくる。

Copilotの画像生成と対話することで自分の中のイメージが固まってくるということもあるので、使われない画像の生成が無駄な作業というわけでもない。対話しながら思考し、イメージづくりを進めていくという思考プロセスだ。

付録: ショートカットキー

ショートカットキー 内容
「Windows」+「C」 Copilot in Windowsの表示・非表示を切り替え

付録: 対応バージョン

OS バージョン
Windows 11 Windows 11, version 22H2以降
Windows 10 Windows 10, version 22H2以降のProおよびHome

参考