Neowinは5月16日(現地時間)、「Microsoft finally brings ChatGPT's popular image generation capability to Copilot」において、MicrosoftのAIアシスタント「Copilot」が、OpenAIのGPT-4oによる高度な画像生成機能を統合したと伝えた。これにより、ユーザーはテキスト指示だけで、高精度な画像を自在に生成・編集できるようになった。
GPT-4oの画像生成サポートでできるようになったこと
GPT-4oはOpenAIが2025年3月に発表した最新のマルチモーダルAIモデルである。このモデルはテキストだけでなくく画像や音声をリアルタイムに処理できる点が大きな特徴で、テキストプロンプトによる指示で高精度な画像や音声を生成することが可能である。また、ユーザーは自分で画像をアップロードして、それをテキストによる指示で編集したり、まったく新しい画像に作り変えたりすることもできる。
ChatGPTにはいち早くGPT-4oが搭載され、ユーザーはDALL·Eのような別のモデルを使わなくても、同一のモデルでテキスト・画像・音声を取り扱えるようになった。MicrosoftのCopilotも、ChatGPTと同様にOpenAIによるAI技術をベースとして構築されているが、最新のアップデートでついにGPT-4oの画像生成機能が利用できるようになった。
Microsoftの公式Xアカウントによる投稿では、2025年5月16日に「4o Image Generationがついにリリースされました」というコメントと共に、Copilotで次のことができるようになったと伝えている。
- 正確で読みやすいテキストをレンダリングする
- 作成したものを編集する
- 複雑な指示に従う
- 既存の画像のスタイルを変換する
- フォトリアリスティックな画像を作成する
同アカウントは、実際にテキストによる指示で画像を微調整していく様子も投稿している。
加速するAI競争、Microsoftの巻き返しはあるか
Copilotユーザーにとっては大きな意味を持つこのリリースだが、前述のように、ChatGPTでは3月の時点で同じ機能を利用することができた。また、GoogleのGeminiも同等のマルチモーダル機能を有している。
CopilotにはWindows OSへの統合という強力なアドバンテージがあるものの、モデルの性能という点では競合他社が一歩先んじているといえる。今後、Microsoftがどのように巻き返していくのか、そのビジョンや戦略に注目が集まっている。