映画館で初めてジュラシック・パークを観た時のような衝撃」、「コンシューマテックの歴史に残るブレイクスルー」など、今年4月の発表時に称賛の声を集めた米OpenAIの画像生成AIツール「DALL·E 2」。その画像生成力を試してみたいと思っていた人に朗報だ。OpenAIが7月20日(米国時間)にDALL·Eのベータ提供を発表、今後数週間で100万人をウェイティングリストから招待する計画を明らかにした。

DALL·Eは、「"An astronaut", "riding a horse", "in a photorealistic style"」(馬に乗る宇宙飛行士をフォトリアリスティックなスタイルで)というような文章から、その内容通りの画像を生成する。人が読んでも想像しづらい抽象的な表現でも、見て納得できるような画像をDALL·E 2が生成し、前述のような驚きの声が上がった。

DALL·Eはバリエーションと編集もサポートする。バリエーションを要求すると、オリジナルの生成画像を基に同じ文章から表現を変えた様々な画像を生成する。また、たとえば「フォトリアリスティックなスタイルで」の部分を「アンディ・ウォーホール風に」に変えるとシルクスクリーンのような表現になるといったように編集できる。

  • 馬に乗る宇宙飛行士

    左はフォトリアリスティックなスタイルで生成した「馬に乗る宇宙飛行士」、右はアンディ・ウォーホール風に編集したバリエーションの1枚

ベータ版のウェイティングリストには、OpenAIが用意したWebページで登録する。ベータ版ではバリエーション、編集機能、そして生成した画像を保管するマイコレクション機能を利用できる。

最初のフェーズのベータ利用者には、最初の月に50クレジット、次の月からは毎月15クレジットを無料提供する。画像生成には、4つの画像を含むオリジナル画像生成に1クレジット、3つの画像が生成されるバリエーションや編集に1クレジットが必要になる。無料クレジットを使い切った場合、115クレジット(最大460枚の画像生成が可能)を15ドルで購入できる。

OpenAIはクリエーターのAI活用に期待しており、20日から生成した画像(リサーチプレビュー中の生成画像を含む)を、転載、販売、商品化を含む商用に利用できるようにした。同社によると、これまでDALL·Eを試した人達から、絵本の挿絵、ニュースレターのアート、ゲームのコンセプトアートやキャラクター、映画の絵コンテといった商用プロジェクトに利用したいという声が多数寄せられていた。

また、悪用のリスクを抑えるための安全対策をベータ版に導入した。リアルな人の顔のアップロード、有名人や著名人の似顔絵の作成、実在する人物の顔の写実的な画像生成などを拒否。コンテンツポリシーに違反する有害な画像作成をブロックできるようにコンテンツフィルターを強化。世界の人々の多様性を反映し、バイアスを低減する新しい技術を導入。さらにAIで自動化した監視と人による監視を組み合わせたモニタリングを導入し、継続的に強化していく。