前回、生成AIには著作権という部分において現在進行系で理解や解釈、法整備などが進んでいる段階であることを説明した。今回は、生成AIが作り出す画像の注意点として理解しておくべき特徴について取り上げる。
マウンテンバイクを描いてみる
以下に示すのは、「ChatGPT Plus(ChatGPT4、DALL・E 3)」で「エベレストのような山の頂きに颯爽とたたずむマウンテンバイクを描画してください。画像は横長でお願いします。」というプロンプト入力で生成した画像だ。
実にそれっぽい画像が生成されている。マウンテンバイクをもっと詳しく見たいので、「マウンテンバイクは画面いっぱいに描画してください。」という指示を追加する。結果として、ここでは次のような画像が得られた。これもまた、それらしく仕上がっている。
しかし、画像を詳しく見てみると、いくつかの違和感に気が付く。このマウンテンバイクはかなりユニークは作りになっており、実際には走らないのではないかということだ。
不思議なポイントを整理すると次のようになる。
- ボトムブラケットではなく、サドルの下50cm~60cmほどの位置のフレームにクランクとペダルがついているように見える。チェーンリングとチェーンはついていない。ペダルもペダルの中央ではなく端が接続されている。さらにフレームの内側へ向かってペダルが付いているため、1回転することはできず、動くとしても180度くらいの可動域しかない
- フレームに直接接続されたクランクとペダルは、本来はリアのフレームに接続されたサスペンション機構を意図している可能性がある。雰囲気的に真似をしているが、サスペンション機構と考えるには稼働する可能性が低く、やはりクランクとペダルが付いているように見える
- チェーンリングがおかしな歪み方をしている
- チェーンがスプロケット(リアのギア)に向かっているようだが、角度からするとスプロケットから外れているように見える
ほかにも疑わしい部分がいくつかあるが、特に上記部分は自転車として動くには致命的な間違いであるように見える。
前回、DALL・E 3の特徴として「テキストによる説明からそれらしい画像を生成できる」と説明したが、この「それらしい画像を生成できる」というところがポイントだ。現実にはあり得ないコトやモノを画像として生成する用途には素晴らしい成果を発揮し、ときに人間の発想に新しい視点を与えてくれる。一方、現実的で物理的に正しい機構を描くような用途には向いていない。