画像生成AIに関しては、さまざまな用途が考えられる。最終回となる今回は、DALL·E 3の特徴の1つである「文字列からそれらしい画像を生成できる」ことに焦点を当て、ユースケースをいくつか紹介する。
創造性の促進
DALL·E 3による画像生成の最も大きな特徴は「文字列からそれらしい画像を生成する」ことであり、生成される画像はときに人間の創造性を刺激する。「この視点があったか」「この考え方は自分にはなかった」といった“気付き”を与えてくれるのだ。
いくつか試してみよう。なお、以降の画像生成は、全て「ChatGPT Plus GPT-4/DALL·E 3 (以降、ChatGPT4)」を使用して行う。
まず、「太陽光、風、波、温度変化などの自然現象から電気や水素を生成するデバイスを書いてください。画像は横長でお願いします。」と指定してみた。生成された画像は次の通りだ。
ChatGPT4は、生成した画像に対して次のような説明文も生成している。
「こちらが自然現象から電気や水素を生成するデバイスを描いた画像です。太陽光パネル、風力タービン、波のエネルギー変換装置、温度変化を利用したサーモエレクトリックジェネレーターが含まれています。この未来的な風景には、これらの技術が調和して効率的に統合されている様子が表現されています。」
さらに「それぞれを個別のデバイスとしてではなく、単一のデバイスにまとめたものを書いてください。」と指示してみる。
生成された画像はなかなか面白いデザインになっている。説明文は次の通りだ。
「こちらが複数の自然現象を一つのユニットで利用する統合型エネルギーデバイスのイメージです。太陽光パネル、風力タービン、波力エネルギー変換装置、温度変化を利用するサーモエレクトリック材料が組み込まれている様子を描いています。このデバイスは、自然環境に調和しながら、効率的にエネルギーを生産する能力を示しています。」
生成AIが生成するイメージは、必ずしも物理法則に支配されているとは限らない。そのため、時として人間が思いつかないような面白い結果を得ることができるのだ。
世界の文化を画像で見る
ChatGPT4はインターネット上に存在する世界中のデータに基づいて処理を行うため、世界の文化を画像で見る、という用途にも使うことができそうだ※。例えば、「高校生」という言葉から想起するイメージは、国や地域によって異なるだろう。ChatGPT4を使うと、その違いを画像で比較することができる。
「こちらがイタリアの高校生を描いた画像です。様々な背景を持つティーンエイジャーが、典型的なイタリアの高校環境でカジュアルな服装を着ています。彼らはバックパックと本を持ち、話したり、勉強したり、ラップトップやスマートフォンを使用するなど、典型的な学校活動に従事しています。背景には、イタリアの高校らしい教室や中庭が描かれており、現代的で活気があり、教育的な雰囲気を反映しています。」
「こちらが日本の高校生を描いた画像です。様々な背景を持つティーンエイジャーが、典型的な日本の高校環境で学校の制服を着ています。彼らはバックパックと本を持ち、話したり、勉強したり、ラップトップやスマートフォンを使用するなど、典型的な学校活動に従事しています。背景には、日本の高校らしい教室や中庭が描かれており、規律正しく、活気があり、教育的な雰囲気を反映しています。」
文化の違いを文字だけで理解するよりも、画像で見ることでより実感が湧きやすくなる。ChatGPT4は世界中のデータをベースに学習を行っているため、こうしたことも可能になっている。
※ 後述するが、生成AIは嘘をつくこともあるのでその点には注意が必要だ。
“未来”を描いてみる
画像生成AIは、短期的にせよ長期的にせよ、未来予想図を描く際のアイデア出しにも使うことができる。次にいくつかのサンプルを掲載する。
「こちらが100年後の未来を想像した都市風景の画像です。この画像には、流線型で環境に優しいデザインの高層ビル、飛行する乗り物、先進的な公共交通システム、豊かな緑の空間が描かれています。人々はハイテクガジェットやロボットと交流しており、全体的な雰囲気は清潔で効率的で持続可能です。この都市は先進的な技術と環境意識の融合を示し、人類と技術、自然との調和した統合を展示しています。」
-
「地球温暖化、環境汚染、石油資源の枯渇、食料不足、原子力発電所問題など、現在の課題が悪化していくと仮定して、100年後の未来を想像し、その様子を描いてください。」 - ChatGPT Plus GPT-4/DALL·E 3
「こちらが100年後の未来を想像したディストピアの風景です。地球温暖化、環境汚染、石油資源の枯渇、食料不足、原子力発電所の問題などの現在の課題が悪化したと仮定した未来が描かれています。この画像には、極端な気象条件、汚染された環境、自然資源の不足、過密な都市が示されています。人々はこれらの厳しい条件に適応するために奮闘しており、水不足、代替エネルギー源への依存、自然界の残りの部分を救うための努力などのシーンがあります。全体的な雰囲気は、大きく変化した世界での苦闘と適応を表しています。」
「こちらが100年後の未来を想像した風景です。この未来では、向こう30年間で石油および石炭が枯渇したと仮定されています。画像には、太陽光、風力、水力などの再生可能エネルギー源への移行が完了した世界が描かれています。風景は進歩したエコフレンドリーな都市、緑の建物、クリーンエネルギーで動く公共交通、電気自動車の広範な使用を特徴としています。人々は持続可能な生活を送っており、都市農業、植林活動、リサイクルや自然保護への強い重点が置かれています。全体的な雰囲気は、化石燃料のない世界での革新と適応を示しています。」
もちろんこれらは単なる予想であり、確実性が高いわけでもない。あくまでも大規模言語モデル(LLM:Large Language Model)によって生成されたデータに過ぎないのだが、興味深い結果ではある。また、短期的にはファッションやデザインの流行を予測するといった方向で、業務的な用途での利用も考えられるだろう。正解が得られるわけではないが、新しい発想のヒントにはなるはずだ。
難しい説明をビジュアルに表現
業務での利用例として、資料の作成を取り上げておく。生成AIは、難しい説明も図示することができる(繰り返すが、生成された結果が正しいかどうかは別途確認が必要だ)。つまり、科学技術のように概念的なものや、難解な説明などを図に起こす際に生成AIを使うと、時短効果を得られるのである。次にいくつかの例を示す。
「こちらがニュートンの第1運動法則を学生に説明するための図です。図では、静止しているオブジェクト(例えばボール)がその状態を維持している様子と、外部からの力が作用しない限り、一定の速度で直線的に運動を続けるオブジェクトを示しています。運動と力を示す矢印を使い、物体が静止または運動の状態を維持する傾向(慣性)の概念を明確で簡潔なビジュアルで示しています。」
「こちらが特殊相対性理論を学生に説明するための横長の図です。この図は、光速が全ての基準系で一定であること、時間の遅れ、及び長さの収縮を表現しています。動いている宇宙船と静止している観測者を用い、時計と定規で時間と空間の測定を示しています。観測者の動きに対して測定がどのように変化するかを示す矢印と簡単な図を含め、これらの概念をアクセスしやすく理解しやすくしています。」
こちらが縄文時代の日本人の生活を描いた画像です。この画像には、藁葺きの家々、樹皮や動物の皮で作られた衣服を着た人々が描かれており、彼らは狩猟、採集、漁業、陶器作りなどの活動に従事しています。自然と調和して生活するコミュニティが描かれ、森林、川、野生動物などの要素が含まれています。このシーンは、縄文人の生活様式や文化を反映しており、彼らの生存技術や芸術的な創造性を強調しています。
当然、生成された画像が科学的・歴史的に正しいかどうかは、知識を持った人間が確認する必要がある。だが、自分で一から書く手間を考えると、圧倒的に作業効率を向上してくれるはずだ。
使ってスキルを高めるなら、今
生成AIによる画像生成サービスは、まだ提供が始まったばかりだ。今後、技術の発展と共に新しい機能が多数実現されていくことが予想される。
留意すべきなのは、生成AIはときに嘘をつくということだ。生成されたものがテキストであっても画像であっても、それが正しいかどうかはユーザーが自分で判断する必要がある。また、生成AIの生成物に関しては、著作権についてまだクリアではない部分が存在していることも常に留意しておかなければならない。
こうした現状ではあるものの、注意点を理解した上でいち早く使い始め、活用スキルを高めておくことをオススメしたい。画像生成AIは、さまざまな可能性を秘めている。精度が高まり、ビジネス活用が本格的に進む日に備え、今から準備しておいていただきたい。