Microsoftの画像生成AI「MAI-Image-2.5」、Arenaランキング3位　OpenAI・Googleに迫る

Microsoftは5月26日(現地時間)、「MAI-Image-2.5 launches at No. 3 on Arena｜Microsoft AI」において、テキストから画像を生成するAIモデル「MAI-Image-2.5」を発表した。

MicrosoftによるAI群の中核モデルとして注目を集めるこの最新モデルは、Arenaのテキスト画像変換ランキングで3位を獲得し、Google DeepMindやOpenAIのモデルに迫る位置へと浮上した。

MAI-Image-2.5はどのようなモデルか

MAI-Imageシリーズは、Microsoftが独自開発する画像生成AIのラインアップだ。同社は2025年からMAI-Image-1、MAI-Image-2と順次このシリーズを投入、今回のMAI-Image-2.5はその最新世代にあたる。バージョン番号は2.5だが、Microsoftによると、これは単なるマイナーアップデートではなく、品質面で前世代から飛躍的な向上を実現しているという。

テキスト描画や商用クリエイティブ向け性能を強化

MAI-Image-2.5が生成した画像例。商品パッケージの文字表現やフォトリアル画像など幅広いスタイルに対応する　出典：Microsoft

MAI-Image-2.5は、幅広いスタイルへの対応力、指示への追従精度、テキスト描画の信頼性、画像全体の一貫性がいずれも大幅に向上した。加えて、物体・シーン構成・照明・スケール・空間的関係といった視覚的な推論能力の強化により、簡潔な指示からでも意図に沿ったクオリティーの高い画像が生成できるようになった。

実用的なクリエイティブ制作においては、テキスト描画と製品・ブランド表現の精度向上が特に注目ポイントとなっている。Microsoftは製品パッケージやブランドイメージの生成例を示し、その再現性の高さをアピールしている。

MAI-Image-2.5が生成したブランド商品イメージ。製品名やラベルなどの文字表現も自然に再現している　出典：Microsoft

ArenaランキングでOpenAIとGoogleに迫る

Arena.AIはArtificial Analysisが運営する画像生成AIモデルの評価プラットフォームだ。ユーザー投票による評価を採用している点が大きな特徴で、画像生成AIモデルを開発する各社が性能競争を繰り広げる場として注目度が高い。

ユーザーは、ランダムに選ばれた2つのモデルに同じプロンプトを与え、生成された画像を比較してどちらがより正確にプロンプトの意図を反映しているかを評価する。どのモデルが使われたのか知らされないブラインド評価であり、この比較投票の結果で順位が決まる仕組みになっている。

MAI-Image-2.5は公開初日で3位にランクインした。順位は前世代のMAI-Image-2と同じだが、Arenaによると評価スコアは72ポイント向上している。首位はOpenAIのgpt-image-2、2位はgemini-3.1-flash-image-previewであり、MAI-Image-2.5はこれらの最新モデルに肩を並べる実力を持つことを証明した。