Microsoft初の画像生成モデル「MAI-Image-1」登場、Copilotに搭載予定

Microsoftは10月13日(米国時間)、「Introducing MAI-Image-1, debuting in the top 10 on LMArena ｜Microsoft AI」において、同社初の画像生成モデル「MAI-Image-1」を発表した。

同社はこれまでOpenAIの製品に依存し、独自のAIモデルを開発してこなかったが、8月の「MAI-Voice-1」および「MAI-1-preview」の発表を皮切りに、立て続けにAIモデルを発表している。今回はこれら製品に続く3番目の新モデルとなる。

なお、6月に発表されたAI医療診断システム「MAI-DxO(Microsoft AI Diagnostic Orchestrator)」は「AIモデル」としてはカウントされていない(参考：「MicrosoftのAI診断システム、人間の医師の4倍の診断成功率を実現 | TECH+（テックプラス）」)。

Introducing MAI-Image-1, debuting in the top 10 on LMArena ｜Microsoft AI

画像生成モデル「MAI-Image-1」の特徴

MAI-Image-1は柔軟性、視覚的な多様性、そして実用的な価値を提供するように設計された画像生成モデルとされる。クリエイティブユースケースを考慮した厳密なデータ選択と繊細な評価を優先し、反復的または一般的な定型出力を避けるトレーニングを行っている。

反射光を含む照明や風景などのフォトリアリスティック(写実的)な画像の生成に優れる特徴を持つ。また、他社の大規模モデルよりも優れたパフォーマンスを発揮するという。

MicrosoftはMAI-Image-1で生成した画像サンプルを複数公開している。これら画像にはプロンプトとみられる解説が付けられており、それぞれ「ロードランナーが、まばらな低木が生い茂る砂漠地帯を砂埃を巻き上げながら駆け抜ける。背景には青い空と遠くのメサが見える」、「コートとジーンズを着た若い男性が、夕暮れ時の街の通りを歩いている。背景には建物、屋外カフェの席、そして自転車が見える。暖かい日差しがドラマチックな金色の輝きを放っている」との記述が確認できる。

MAI-Image-1で生成した画像サンプル1　引用：Microsoft

MAI-Image-1で生成した画像サンプル2　引用：Microsoft

LMArenaでフィードバックを募集中、Copilotに搭載予定

MAI-Image-1はAI比較プラットフォーム「LMArena」にて試用することができる。ダイレクトチャットでMAI-Image-1を選択し、画像生成モードでプロンプトを入力すると画像を生成可能だ。本稿執筆時点におけるバトルモードの評価では、Googleのgemini-2.5-flash-image-preview(1位)やOpenAIのgpt-image-1(7位)に次ぐ9位に位置している。

競合他社よりわずかに低い評価となっているが、Microsoft AIの最高経営責任者(CEO: Chief Executive Officer)を務めるMustafa Suleyman氏はXへの投稿で「今後も改良を重ね、リーダーボードの上位を目指します。これは始まりに過ぎません」と述べ、競合他社に劣らないAIモデルを目指す方針を明らかにしている。