生成AIを使って自然言語から画像を生成するサービスやソフトウエアはいくつか存在している。この数年で登場した新しいサービスが多い。今回はこうした生成AI技術を使った画像生成サービスやソフトウエアの中でも、特に人気のあるものをピックアップして紹介する。

OpenAIの「DALL·E 3」

まずは、本連載の主題にもなっている「DALL·E 3」だ。ChatGPTを開発したOpenAIが提供する最新の画像生成モデルであり、従来のモデルよりも入力された文章の内容に忠実に画像を生成できるようになったと評価されている。

OpenAIの画像生成技術について、ユーザーの認知度を高めたきっかけは、2021年1月に発表された「DALL·E」だろう。このモデルは当時のChatGPTで使われていたGPT-3 (120億パラメータバージョン)でトレーニングされたもので、自然言語から“それらしい画像”を生成できることを世界中のユーザーが知ることになった。

DALL·Eでは、さまざまなものを擬人化させたり、まるで無関係なものを組み合わせてユニークな画像を生成したりすることができる点が特徴だ。そのため、生成される画像は「現実」という観点から見ると誤ったものもある。

OpenAIは2022年、DALL·Eの4倍の解像度で、よりリアルかつ正確な画像を生成できる「DALL·E 2」の提供を開始。そして2023年9月には、本稿執筆時点で最新版となる「DALL·E 3」を発表した。前バージョンよりも、指定された自然言語から多くのニュアンスを読み取ることで、アイデアをより正確に画像に反映できるようになったとされている。

  • ChatGPT GPT4/DALL·E 3で「DALL·E 3の開発を行っている牛のプログラマの絵を書いてください。アニメ調で。ちょっとコミカルな感じでお願いします。絵は横長で作成してください。」で生成した画像のサンプル

    ChatGPT GPT4/DALL·E 3で「DALL·E 3の開発を行っている牛のプログラマの絵を書いてください。アニメ調で。ちょっとコミカルな感じでお願いします。絵は横長で作成してください。」で生成した画像のサンプル

OpenAIのDALL·E 3は有償版の「ChatGPT Plus」や「ChatGPT Enterprise」から利用できる。OpenAIは、DALL·E 3で生成した画像の権利をユーザーに譲るとし、商用利用も可能だとしている。現時点で最もシンプルに扱えるサービスの一つだ。

Stability AIの「Stable Diffusion」

この記事は
Members+会員の方のみ御覧いただけます

ログイン/無料会員登録

会員サービスの詳細はこちら