Microsoftは5月26日(現地時間)、「MAI-Image-2.5 launches at No. 3 on Arena|Microsoft AI」において、テキストから画像を生成するAIモデル「MAI-Image-2.5」を発表した。
MicrosoftによるAI群の中核モデルとして注目を集めるこの最新モデルは、Arenaのテキスト画像変換ランキングで3位を獲得し、Google DeepMindやOpenAIのモデルに迫る位置へと浮上した。
MAI-Image-2.5はどのようなモデルか
MAI-Imageシリーズは、Microsoftが独自開発する画像生成AIのラインアップだ。同社は2025年からMAI-Image-1、MAI-Image-2と順次このシリーズを投入、今回のMAI-Image-2.5はその最新世代にあたる。バージョン番号は2.5だが、Microsoftによると、これは単なるマイナーアップデートではなく、品質面で前世代から飛躍的な向上を実現しているという。
テキスト描画や商用クリエイティブ向け性能を強化
MAI-Image-2.5は、幅広いスタイルへの対応力、指示への追従精度、テキスト描画の信頼性、画像全体の一貫性がいずれも大幅に向上した。加えて、物体・シーン構成・照明・スケール・空間的関係といった視覚的な推論能力の強化により、簡潔な指示からでも意図に沿ったクオリティーの高い画像が生成できるようになった。
実用的なクリエイティブ制作においては、テキスト描画と製品・ブランド表現の精度向上が特に注目ポイントとなっている。Microsoftは製品パッケージやブランドイメージの生成例を示し、その再現性の高さをアピールしている。
ArenaランキングでOpenAIとGoogleに迫る
Arena.AIはArtificial Analysisが運営する画像生成AIモデルの評価プラットフォームだ。ユーザー投票による評価を採用している点が大きな特徴で、画像生成AIモデルを開発する各社が性能競争を繰り広げる場として注目度が高い。
ユーザーは、ランダムに選ばれた2つのモデルに同じプロンプトを与え、生成された画像を比較してどちらがより正確にプロンプトの意図を反映しているかを評価する。どのモデルが使われたのか知らされないブラインド評価であり、この比較投票の結果で順位が決まる仕組みになっている。
MAI-Image-2.5は公開初日で3位にランクインした。順位は前世代のMAI-Image-2と同じだが、Arenaによると評価スコアは72ポイント向上している。首位はOpenAIのgpt-image-2、2位はgemini-3.1-flash-image-previewであり、MAI-Image-2.5はこれらの最新モデルに肩を並べる実力を持つことを証明した。
現時点でMAI-Image-2.5はArenaで利用可能となっている。Microsoftは発表から2週間以内にMAI PlaygroundおよびMicrosoft Foundryへの提供も開始すると予告している。


