米Microsoftは3月21日(現地時間)、「Bing Image Creator」(プレビュー)を発表、プレビュー提供中の「新しいBing」に統合して提供する。言葉による説明から画像を生成するAIツールで、同社と提携するOpenAIの画像生成AI「DALL∙E」の最新のモデルを搭載している。21日に「新しいBing」のプレビュー参加者の一部からロールアウトを開始(デスクトップ、モバイル)。また、Image Creatorの画像生成を誰でもシンプルに試せるbing.com/createを用意した(サポート言語:英語)。
新しいBingのチャット機能で画像を生成するには、「独創性」スタイルで「draw an image」(画像を描いて)または「create an image」(画像を作成して)というプロンプトを入力する。
人の脳は視覚情報をテキストの約60,000倍の速さで処理することが研究でわかっており、言葉を使った対話だけではなく、ビジュアルも使用できるようになることでユーザーと対話型AIの理解が深まるとしている。例えば、1940~60年代にブームになった家具を使ったリビングルームの模様替えのアイディアをBingに提案してもらう際に、「天然木の家具」や「サンバーストの時計」と言葉で説明してもらってもイメージしにくい。そこで「そのリビングルームの画像を作成して」と頼むと、それらを使った部屋の画像をBingが生成する。
画像生成AIの中でもDALL∙Eは安全性を重視した設計になっているが、OpenAIのセーフガードに加えて、Image CreatorにはMicrosoftによる保護が組み込まれている。安全ではない画像の生成を制限する制御機能を導入しており、プロンプトによって有害な画像が生成される可能性をシステムが検知した場合、プロンプトをブロックしてユーザーに警告を発する。またImage Creatorが生成した画像の左下にBingのアイコンを付けるなど、画像がAIによって生成されたものであることを明確に伝える。
Image Creatorは、Microsoft EdgeでもサイドバーのImage Creatorアイコンから利用できるようになる(英語)。また「新しいBing」ボタンからアクセスするチャットでもImage Creatorを利用できるようにし、近日中に同機能を搭載したEdgeのプレビュー版を提供する予定。
ビジュアルを組み合わせた検索体験をさらに高めるために、「Visual Stories」と「Knowledge Cards 2.0」も提供する。Storiesは画像やショートビデオを用いたインタラクティブなコンテンツでより魅力的な検索を提供する。Knowledge Cardsはチャートやグラフ、タイムライン、Storiesなどを含む豊富なコンテンツを、AIを活用してインフォグラフィックのようなレイアウトにまとめて提供する。