狙ったロゴを作成させるためのティップスをさらに取り上げるとともに、現在のバージョンではどうにもならないくらい苦手な処理として「日本語」を描くことについて説明する。この点に関しては現在のバージョンでは実現する方法がないので、今後の改善が期待されるところだ。
連載「Copilot in Windowsを使ってみよう」のこれまでの回はこちらを参照。
対話をひとつのプロンプトにまとめる
これまで何度も取り上げてきたように、Copilot in Windowsが使っているDALL・E 3はプロンプトに対して毎回新しい画像を生成する仕組みになっている。このため、流れの中で既存の画像の一部を加工するといったような使い方は難しい場合がある。
試行錯誤をする上では対話しながら画像の生成を繰り返していく方法が便利だが、ある程度対話を行って目的とするニュアンスの画像が生成できるようになったら、これまでに対話で指示した内容をひとつにまとめて、それを1回のプロンプトで指示するようにしてみると良い。
ここでは、これまでに対話してきた内容を次のような文章としてまとめる。
現在開発部で業務の残業時間管理システムとして「時間守護」と呼ばれるシステムを開発しています。残業が特定の従業員に偏らずにだいたいどの従業員にも同じように残業の割当ができるような管理システムです。このシステムの開発に合わせて、システムのロゴを作成する必要があります。残業時間管理システム「時間守護」に合うかっこいいロゴをいくつか提案してください。ロゴには、残業時間をイメージさせるために「時計」を、業務管理をイメージさせるために見守るという意味で「ミミズク」を含めてください。立体的ではなく、平面的なデザインにしてください。背景は白にしてください。ロゴは白黒で構成してください。
この指示をプロンプトに渡すと次のように動作する。
これまでは複数回の対話のあとに生成されていたロゴが、1発目から生成されていることを確認できる。
この動作は生成AIによる画像生成において特徴的なものだ。より詳細に多くの情報を指定した方が、自分の意図する画像を生成せさやすくなる。これは生成AIがそうした仕組みで動作しているからで、この技術の特徴的な動作だ。特徴を理解し、それに合うようにプロンプトに入力を行うことが大切だと言える。
生成される画像は一期一会
生成したい画像を指定するプロンプトが定まったら、その指定を何度も繰り返して画像を生成させていく。このようにして複数の画像を生成し、その中から自分が求めているものと探っていくのだ。以下には、先ほどのプロンプト指定を繰り返してロゴデータを生成していくサンプルを示す。
上記スクリーンショットからも分かるように、Copilot in Windowsは毎回異なる画像を生成する。これはつまり、気に入った画像が生成されても、その画像には二度とお目にかかれない可能性が高いということを意味している。生成AIの画像は一期一会になりやすい。
Copilot in Windowsは過去の対話を記録しているので、過去に生成した画像に関しては履歴からたどって表示させることができる。そのため、以前気に入った画像が生成されているのであれば、履歴から過去の画像にアクセスすることができる。
英語のタイトルは追加できる
画像に文字列を追加したいというのはよくあることだが、生成AIの場合には細かく指定して意図した文字列を追加することは難しい。できなくもないのだが、出来上がったものが想定しているものになるかどうかは分からない。
例えば、先ほど生成したロゴのうち、次のロゴデータにタイトルを追加しようと考えたとする。
これまでに説明したように、スレッドをクリアしてからロゴデータを読み込ませて指定を行う。
画像の下部に「TIME GUARDIAN」というタイトルを追加してください。
処理を行うと次のようになる。
前回説明したようにデザインそのものが大きく異なってしまうのでどこまで使い物になるかは微妙なところだが、次のロゴデータのように「TIME GUARDIAN」という指定した文字列が入るようになったことは確認できる。
日本語のタイトルは追加できない
では日本語の文字列を追加することもできるのではないかと考えると思うが、現在のバージョンはこの動きに対応していない。
次のようにプロンプトに指示する内容を用意する。
画像の下部に「時間守護」というタイトルを追加してください。
実行すると次のようになる。
漢字のように見えるものの何語かよくわからない文字列が入った画像が生成されることが分かる。
Copilot in Windowsが使っているDALL・E 3は英語の指定に関しては理解してくれるものの、日本語は理解してくれない。このため日本語文字列の指定を行うと、なにか漢字のように見えるものが描画されるものの、日本語を正しく描画してはくれない。
この点に関しては日本語への対応を行うことで英語と同じようにレンダリング可能にすることはでき、すでにそうした処理を実現した生成AIサービスも存在している。Copilot in Windowsが日本語レンダリングに対応するかどうかは現時点ではなんとも言えない。今のところCopilot in Windowsで使う画像生成ほど簡単に利用を開始できる画像生成サービスはないので、競合が登場しない限り現在の機能のままという可能性もある。
日本語の扱いは今後の改善に期待
直接プロンプトで日本語文字列を書くように指定すると分かることだが、日本語を含むような画像を生成するように指示した場合にもこのよく分からない漢字のような文字が表示される現象を確認できる。日本の居酒屋であるとか街並み、看板に日本語が含まれているものをレンダリングすることになるような指示を行うと、そこに不思議な文字列が表示されるのだ。
生成AIを使って作った画像をどのように扱っていくかは現在進行系で世界中で模索が行われている段階にあるが、プロンプトスキルを上げていくことで意図した画像が生成しやすくなるのは間違いなく、この時点からいろいろと試行錯誤しておくことは悪くないだろう。生成AIの動作の特報を理解する上でも分かりやすい演習になるので、ぜひ自分でいろいろと試していただければと思う。
付録: ショートカットキー
ショートカットキー | 内容 |
---|---|
「Windows」+「C」 | Copilot in Windowsの表示・非表示を切り替え |
付録: 対応バージョン
OS | バージョン |
---|---|
Windows 11 | Windows 11, version 22H2以降 |
Windows 10 | Windows 10, version 22H2以降のProおよびHome |
参考
- Copilot in Windows & Other AI-Powered Features | Microsoft
- Copilot documentation | Microsoft Learn
- Adopt, extend and build Copilot experiences across the Microsoft Cloud | Microsoft Learn
- Bringing the power of AI to Windows 11 - unlocking a new era of productivity for customers and developers with Windows Copilot and Dev Home - Windows Developer Blog