生成AIはその構造上、プロンプトにまったく同じ入力を行っても毎回違う結果が出力される。具体的にどのような経緯でそうなっているのかをユーザーが知る方法はないが、ベースとなっている大規模言語モデル(LLM: Large Language Model)がそういった仕組みになっている。これはこの技術の特徴的な動作だ。今回はロゴの生成を通じてこの特性を体感してみよう。
連載「Copilot in Windowsを使ってみよう」のこれまでの回はこちらを参照。
同じプロンプトでも異なる返答、それが生成AI
生成AIはその構造上、プロンプトに同じ指示を行っても毎回異なる出力が行われる。自然言語で質問を行った場合には返ってくる返答の結論にはそれほど違いはないかもれないが、説明の仕方や言い回しなどがその都度違ったものになる。
これに対して従来の専門家システムは決定論的な構造になっており、同じ質問を行った場合には基本的に同じ回答が得られる。これが従来の決定論的なシステムと生成AIの大きな違いと言える。
この違いは画像生成などについて特にその違いが分かりやすい。前回のロゴ生成の話をベースに、さらにこの非決定論的な動きを体感してみよう。
同じ質問で生成されるロゴはどう変わるか
前回は次の質問をプロンプトに対して入力してロゴの生成を行った。
現在開発部で業務の残業時間管理システムとして「時間守護」と呼ばれるシステムを開発しています。残業が特定の従業員に偏らずにだいたいどの従業員にも同じように残業の割当ができるような管理システムです。このシステムの開発に合わせて、システムのロゴを作成する必要があります。残業時間管理システム「時間守護」に合うかっこいいロゴをいくつか提案してください。
右上の「↻」アイコンをクリックしてスレッドを新しくしてから上記質問をプロンプトに入力すると、次の結果が得られる。
すでにこの段階で前回生成されたロゴとは異なるロゴが生成されていることが分かる。ここでもう一度右上の「↻」アイコンをクリックしてスレッドを新しくしてから同じ指示をプロンプトに入力すると、次の結果が得られる。
同じ指示から、先ほど生成された4つのロゴとはまた異なるロゴが生成されている。
さらに右上の「↻」アイコンをクリックしてスレッドを新しくしてから同じ指示をプロンプトに入力すると、次の結果が得られる。
スレッドを更新して再度指示を行っているのは先に入力したプロンプトの影響を避けるためだ(ただし、Copilot in Windowsが他のスレッドの内容を完全に独立したものとして扱っているのかユーザーが知る術はないので、何らかの関連が行われている可能性はある)。
出力結果はここまで変わる
生成されたロゴデータをざっと列挙すると次のようになる。同じ指示であるにもかかわらず、ここまで異なるデータが生成されるということを感じてもらえればと思う。
この結果はCopilot in Windowsを使って画像を生成する場合の大きな示唆を含んでいる。この画像生成機能DALL・E 3を提供しているOpenAIは、DALL・E 3の使い方として、想像力の促進といった面を強く押し出している。DALL・E 3を使ってそのまま使えるものを生成するというよりも、考えも付かないイメージを生成してアイデアのベースとして活用するといった使い方を紹介している。
その理由のひとつが、このように同じ指示に対しても毎回まったく異なる画像を生成するというこの機能そのものにある。同じ指示に対して同じ出力を返す決定論的なシステムと異なり、非決定論的な生成AIは異なる出力を返す。同じ出力が得られないので、どちらかというと何度も繰り返し生成してアイデアを刺激するといった使い方が向いているということになる。
画像を指定して編集を進める
前回取り上げた使い方では対話による画像の書き換えの対話があまり成り立っていなかった。今回はその対話をちょっとだけ成り立ちやすくするポイントを紹介する。
先ほど生成した画像のうち、ミミズクまたはフクロウと見られる猛禽類が使われた水色ベースのロゴをベースにしていきたいと考えたとする。前回はスレッドを切らずに続けて対話を行っていったが、ここで右上の「↻」をクリックしてスレッドを新しくし、その上で次のスクリーンショットのように画像をアップロードした上で次のような指示を行う。
この画像をさらにシンプルにしてロゴとして扱えるものを生成してください。
すると上記スクリーンショットのように白黒のミミズクまたはフクロウモチーフのロゴが生成される。前回は同じスレッドの中で編集を指示したため対話がうまくいかなかったが、一旦スレッドを切ることで余計な事前情報がなくなったためか、想定外のロゴには変化していないように見える。
さらに次の指示を行ってみる。
もっとカラフルにしてみてください。
さらに次の指示を行う。
OVERTIMEという文字列を入れてください。
このように一旦スレッドを切ってから編集を指示することで、ある程度自分の意図する編集を行いやすくすることができる。思ったとおりに編集をさせることは難しいが、こうした工夫をすることで変化をもたらすことは可能だ。
使いこなす方法を体感していこう
無償でDALL・E 3による画像生成機能を利用できるCopilot in Windowsは自分でこうした画像を作成することができないユーザーにとっても便利なツールであり、使いこなせればこれまでは実現できなかったことを自らの手でできるようになるという可能性を秘めている。
同じ指示に対して毎回異なる画像を生成するという特性を理解し、この特性を活かした使い方を身につけるということがポイントだ。実際に自分で画像の生成を指示してその動きを体験してもらえればと思う。
付録: ショートカットキー
ショートカットキー | 内容 |
---|---|
「Windows」+「C」 | Copilot in Windowsの表示・非表示を切り替え |
付録: 対応バージョン
OS | バージョン |
---|---|
Windows 11 | Windows 11, version 22H2以降 |
Windows 10 | Windows 10, version 22H2以降のProおよびHome |
参考
- Copilot in Windows & Other AI-Powered Features | Microsoft
- Copilot documentation | Microsoft Learn
- Adopt, extend and build Copilot experiences across the Microsoft Cloud | Microsoft Learn
- Bringing the power of AI to Windows 11 - unlocking a new era of productivity for customers and developers with Windows Copilot and Dev Home - Windows Developer Blog