Copilot in Windowsに統合されている画像生成機能は現在存在している生成AIサービスの中で特徴的なものだ。生成AIサービスは発展が著しい状況だが、それでも画像生成サービスを手軽に使えるものはほとんどなく、依然としてCopilotを特徴付ける機能になっている。今回は画像生成機能について、他のサービスの状況を簡単にまとめておく
連載「Copilot in Windowsを使ってみよう」のこれまでの回はこちらを参照。
OpenAI ChatGPT Plus
Copilot in Windowsの画像生成機能はOpenAIのDALL・E 3が使われている。OpenAIは生成AI「ChatGPT」を提供しており、当然ながらChatGPTにもDALL・E 3を使った画像生成機能が用意されている。
ただし、執筆時点では画像生成機能はChatGTPの有償版である「ChatGPT Plus」や企業向けのChatGPTプランで提供されている機能になっており、Copilot in Windowsのように無償で利用できる機能としては提供されていない。無償版でも画像生成ができるというのがCopilotの強みだ。
仮に、ChatGPT Plusの最新モデル「ChatGPT 4o」で画像生成を行ってみる。Copilotに指示したのと同じ次の指示をプロンプトに与える。
現在弊社の開発部で業務の残業時間管理システムとして「時間守護」と呼ばれるシステムを開発しています。残業が特定の従業員に偏らずにだいたいどの従業員にも同じように残業の割当ができるような管理システムです。このシステムの開発に合わせて、システムのロゴを作成する必要があります。残業時間管理システム「時間守護」に合うロゴを生成してください。ロゴに、残業時間をイメージさせるために「時計」を、業務基準超過を監視するという意味で「ミミズク」を含めてください。ロゴの下部には「時間守護」という文字列を入れてください。立体的ではなく、平面的なデザインにしてください。背景は白にしてください。ロゴは白黒で描いてください。
Copilotで実施したときと同じようなロゴが生成されていることが分かる。同じエンジンを使っているとみられるため、同じような画像が生成されるのは当然だろう。そしてCopilotの画像生成で日本語を扱うことができなかったように、ChatGPT Plusでも日本語の描画ができていないことも分かる。
この点についてChatGPTに次のように聞いてみる。
指定した「時間守護」という日本語が、まったく別のものになっています。どこの国の言語でもないようです。あなたはまだ日本語を描くことができませんね?
ChatGPTはもう一度ロゴを作成するといって、またどこの国の言語か分からない漢字っぽい何かの文字列をレンダリングしたロゴを生成した。ここで再度同じような確認を行ってみる。
「時間守護」という日本語が、まったく別のものになっています。どこの国の言語でもないようです。あなたはまだ日本語を描くことができませんね?
今度はChatGPTは自分が日本語のロゴをレンダリングできないことを認識し、その代替案として他のデザインツールを使ってロゴを修正する案を提案している。DALL・E 3自体は日本語を扱うことができないが、DALL・E 3を扱うChatGPT 4oの方は進歩しており、画像の内容を認識するようになっている。画像に日本語が含まれていないことを認識し、画像編集アプリケーションを使って日本語テキストを追加する方法を提案したわけだ。このあたりの動作はCopilotよりも先を行っている。
この状態で最初とまったく同じ指示をプロンプトに入力する。
現在弊社の開発部で業務の残業時間管理システムとして「時間守護」と呼ばれるシステムを開発しています。残業が特定の従業員に偏らずにだいたいどの従業員にも同じように残業の割当ができるような管理システムです。このシステムの開発に合わせて、システムのロゴを作成する必要があります。残業時間管理システム「時間守護」に合うロゴを生成してください。ロゴに、残業時間をイメージさせるために「時計」を、業務基準超過を監視するという意味で「ミミズク」を含めてください。ロゴの下部には「時間守護」という文字列を入れてください。立体的ではなく、平面的なデザインにしてください。背景は白にしてください。ロゴは白黒で描いてください。
ロゴを生成したものの、当然ながら日本語のレンダリングはできていない。ChatGPT 4oは日本語がレンダリングできていないことを認識し、画像の表示に合わせて次の提案も行っている。
- 提供されたロゴデザインを使用して、Adobe IllustratorやPhotoshopなどのデザインソフトウエアで「時間守護」という文字列を手動で追加する
- 他のデザインツールを使用して日本語の文字を追加する
執筆時点ではChatGPT PlusもCopilot in WindowsもDALL・E 3を使っており、画像生成機能の性能に大きな違いはない。ただし、ChatGPTは言語モデルとして最新の「ChatGPT 4o」を使っており、その点でChatGPT Plusの方が融通が効くようにみえる。画像生成機能を重点的に使う場合にはCopilotで十分だと考えられるが、より賢い支援も含めて生成AIのサポートが必要という場合にはChatGPT Plusを使うことを検討するのもひとつの選択肢だ。
Google Gemini
無償で簡単に利用を開始できるもうひとつの生成AIサービスが「Google Gemini」だ。
Google Geminiに先ほどと同じ指示を出す。
現在弊社の開発部で業務の残業時間管理システムとして「時間守護」と呼ばれるシステムを開発しています。残業が特定の従業員に偏らずにだいたいどの従業員にも同じように残業の割当ができるような管理システムです。このシステムの開発に合わせて、システムのロゴを作成する必要があります。残業時間管理システム「時間守護」に合うロゴを生成してください。ロゴに、残業時間をイメージさせるために「時計」を、業務基準超過を監視するという意味で「ミミズク」を含めてください。ロゴの下部には「時間守護」という文字列を入れてください。立体的ではなく、平面的なデザインにしてください。背景は白にしてください。ロゴは白黒で描いてください。
こちらの言語での Gemini の画像生成機能の向上に取り組んでおります。まもなくご利用いただけるようになる予定です。ご利用可能になりましたら、リリースノートを更新いたします。
上記スクリーンショットのようにGeminiは画像生成に対応していない旨を回答してくる。さらに次の指示をGeminiのプロンプトに与える。
Googleは画像生成用の生成AIの開発を進めていますね
Googleは現在画像生成AIの開発に取り組んでおり、研究開発の段階にあるものが存在している。Geminiはこうした状況を踏まえて次のように回答した。
はい、Googleは画像生成用の生成AIの開発を進めており、いくつかのツールとサービスがすでにリリースされています。
- Imagen: テキストの説明からフォトリアルな画像を生成するAIシステムです。まだ研究段階ですが、非常に高精度な画像生成が可能で、将来的に様々な用途での活用が期待されています (参考「Imagen: Text-to-Image Diffusion Models」)
- ImageFX: Google AI Test Kitchenで提供されているツールで、アップロードされた画像を様々なエフェクトで加工したり、AIを使って画像の一部を編集したりすることができます (参考「ImageFX」)
- Vertex AI の Imagen: Google Cloud上で利用できるImagenのサービスです。Imagenの機能に加えて、アップロードされた画像のスケーリングや、特定の対象に特化した画像生成、画像の説明テキストの取得、視覚的な質問応答など、様々な機能を利用できます (参考「Vertex AI の Imagen | AI 画像生成ツール | Vertex AI の生成 AI | Google Cloud」)
- Google 広告の画像生成: Google 広告で利用できる機能で、テキストの説明から広告用の画像を自動的に生成することができます (参考「Generate and edit images with Google AI - Google Ads Help」)
Googleはまだ誰もが広く使用できる画像生成AIについてはサービスを提供していない状況だ。いつどのタイミングで投入されるかも分からない。今のところ、広く使われている生成AIサービスのうち、無償で画像生成を行うことができるのはCopilotのみという状況だと言える。
Stable Diffusion
画像生成AIとしては「Stable Diffusion」も有名だ。
Stable Diffusionは次のように有償で提供されている。
無償で利用できるCopilot in Windowsで画像生成ができることが強い特徴になっていることが分かる。
Midjourney
画像生成AIとしては「Midjourney」にも人気がある。
こちらも有償プランでの提供になっており、無償で利用できるという点でCopilot in Windowsの画像生成機能が現時点で特徴的なものであることが分かる。
Copilotの画像生成機能はとってもお得
このように、執筆時点において無料で手軽に利用できるCopilot in Windowsの画像生成機能は唯一無二に近い存在となっている。今後OpenAIがChatGPTの無償版にDALL・E 3を公開した場合には状況が変わることになるが、そうならない限りはCopilotは無料で手軽に画像生成を行うことができるツールという立場であり続けるだろう。
登場してまだ日の浅い技術だが、この技術は作業効率を劇的に引き上げる可能性を秘めている。今から対話を通じて使い方を学んでいくことが悪くない投資だ。ぜひ繰り返し使ってその特徴を掴んでもらえればと思う。
付録: ショートカットキー
ショートカットキー | 内容 |
---|---|
「Windows」+「C」 | Copilot in Windowsの表示・非表示を切り替え |
付録: 対応バージョン
OS | バージョン |
---|---|
Windows 11 | Windows 11, version 22H2以降 |
Windows 10 | Windows 10, version 22H2以降のProおよびHome |
参考
- Copilot in Windows & Other AI-Powered Features | Microsoft
- Copilot documentation | Microsoft Learn
- Adopt, extend and build Copilot experiences across the Microsoft Cloud | Microsoft Learn
- Bringing the power of AI to Windows 11 - unlocking a new era of productivity for customers and developers with Windows Copilot and Dev Home - Windows Developer Blog