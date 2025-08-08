米OpenAIは8月7日（現地時間）、ライブストリーミング形式のイベント「OpenAI Summer Update」を開催し、最新のフラッグシップAIモデルとなる「GPT-5」を発表した。ChatGPTの新たなデフォルトモデルとして、同日よりPlus、Pro、Teamおよび無料プランへの展開が開始された。

イベント冒頭、CEOのサム・アルトマン氏は従来モデルとの違いについて次のように述べた。

「GPT-3は、まるで高校生と話しているような感じだった。ときおり驚くようなひらめきもあったが、同時に多くの苛立ちもあり、それでも人々は使い始め、ある程度の価値を見いだしていった。GPT-4oになると、大学生と話しているような印象で、知性も実用性も本物だった。そしてGPT-5は、あらゆる分野に精通した専門家 -- 博士レベルの専門家と話しているかのようで、ユーザーの目的に応じて必要な支援をその場で提供してくれる存在となっている」

「OpenAI Summer Update」より

GPT-5は、GPTシリーズおよびoシリーズで培った技術を統合したモデルであり、複雑な推論力と迅速な応答性を兼ね備えている。一般のChatGPTユーザー向けには以下の3つの階層が提供される。

GPT-5 ：全てのユーザーが利用できるデフォルトのモデル。幅広い質問や依頼に対して、推論と速度のバランスが取れた応答を提供する。

：全てのユーザーが利用できるデフォルトのモデル。幅広い質問や依頼に対して、推論と速度のバランスが取れた応答を提供する。 GPT-5 Pro ：月額200ドルのProプラン加入者向けに提供される高性能モデル。より深く長い推論が可能で、複雑なマルチステップのタスクに最適化されている。

：月額200ドルのProプラン加入者向けに提供される高性能モデル。より深く長い推論が可能で、複雑なマルチステップのタスクに最適化されている。 GPT-5 mini ：速度とコスト効率に優れた軽量版モデル。無料プランやPlusプランで使用上限に達した場合に自動的に適用される。

モデル選択が不要なユニファイドシステム

ChatGPTのメジャーアップデートの歴史を振り返ると、2022年のGPT-3.5で自然な対話能力が飛躍的に向上し、続くGPT-4ではマルチモーダル対応などの多機能化が進んだ。そして今回、GPT-5では「ユニファイドシステム（統合システム）」の導入によって、ユーザー体験が向上する。

ユニファイドシステムは、ユーザーが投げかける質問やタスクの性質に応じて、AIが自ら最適な応答方法を選択する仕組みである。

これまでChatGPTには、事前学習型のGPTシリーズと、2024年に登場した推論強化型のoシリーズが存在し、さらにサイズの違いによって複数のモデルが並立していた。これにより、最適なモデル選択に悩むユーザーも少なくなかった。GPT-5はサインイン済みユーザーに対し、GPT‑4o、o3、o4-mini、GPT‑4.1、GPT‑4.5に代わる新たな標準モデルとして適用される。

具体的には、高速な応答が求められる簡単な質問には軽量で効率的なモデルを、複雑な専門領域のタスクには深い推論が可能なモデルを使用する。これを制御するのが「リアルタイム・ルーター」であり、会話の種類や複雑さ、ツールの必要性、明示的な指示などに基づいて最適なモデルを選定する。ルーターは、ユーザーがモデルを切り替えたタイミング、回答に対する選好率など、さまざまなシグナルをもとに継続的に学習しながら精度を改善していく。

現時点ではGPT-5という名称の下に複数の機能モデルが共存しているが、将来的にはこれらを完全に統合し、単一のモデルとして提供する計画がある。

ベンチマークスコア

OpenAIによると、GPT-5は数学、コーディング、多言語理解、健康などの分野で新たな最高水準（State-of-the-Art）を達成した。

コーディング能力 ：「SWE-bench Verified」ではGPT-5（Thinking使用時）が74.9％を記録し、AnthropicのClaude Opus 4.1（74.5％）をわずかに上回った。

：「SWE-bench Verified」ではGPT-5（Thinking使用時）が74.9％を記録し、AnthropicのClaude Opus 4.1（74.5％）をわずかに上回った。 科学的知識 ：博士レベルの科学知識を問う「GPQA Diamond」では88.4％のスコアを記録し、Grok 4（87.5％）やClaude Opus 4.1（80.9％）を上回った。

：博士レベルの科学知識を問う「GPQA Diamond」では88.4％のスコアを記録し、Grok 4（87.5％）やClaude Opus 4.1（80.9％）を上回った。 数学的能力 ：「AIME 2025」ではツールを使わずに96.7％という高い正答率を達成した。

：「AIME 2025」ではツールを使わずに96.7％という高い正答率を達成した。 健康・医療分野 ：「HealthBench Hard」ではGPT-5（Thinking使用時）が46.2％を記録。ハルシネーションの発生率は1.6％にとどまり、GPT-4o（12.9％）やo3（15.8％）から大幅に改善されている。

また、創造的な表現力も向上している。OpenAIが公開した詩の比較例では、GPT-4oが比較的定型的な表現にとどまるのに対し、GPT-5は「black flags of a country that no longer exists（もはや存在しない国の黒い旗）」、「steps to a door that opens only when you stop knocking（ノックをやめたときにだけ開くドアへの歩み）」など、印象的な表現を含む作品を生成した。

ハルシネーションの削減も大きな成果の一つである。OpenAIによると、回答が事実誤認を含む可能性は、GPT-4oと比較して約45％、OpenAI o3と比較して「思考モード（thinking）」時に約80％低下している。

Microsoft Copilotに「スマートモード」として搭載

GPT-5は、OpenAIのパートナーであるMicrosoftの製品群にも統合される。

7日より、AIアシスタント「Microsoft Copilot」において、「Smart」モードを選択することでGPT-5を体験できるようになる。Smartモードではリアルタイム・ルーターが働き、タスクに最適なモデルが自動選択される。

GitHubは、すべての有料GitHub CopilotプランにGPT-5を導入する。開発者は、GitHub Copilot Chat（github.com、Visual Studio Code、GitHub Mobile）上でモデルピッカーを使い、GPT-5を用いてコードの記述、テスト、デプロイを行うことができる。さらに、Azure AI Foundryの拡張機能を利用すれば、VS Code内でエージェント開発を完結させることも可能である。

Azure AI Foundryでは、GPT-5をはじめとする複数のモデルが利用可能となっており、モデルルーターによって各タスクに最適なモデルを自動選択できる。これにより、開発者は性能、コスト、応答時間のバランスをとりながら柔軟にAIを活用できるようになる。