米OpenAIは2月27日(現地時間)、最新の大規模言語モデル(LLM)「GPT-4.5」を発表し、リサーチプレビューを開始した。同モデルは、計算リソースとデータ量を拡大して構築され、より深い知識と向上した「感情知能(EQ)」を備えている。GPT-4o(高速・低コスト化、マルチモーダル対応)とは異なる方向性でスケールアップされた、知識・精度を強化したGPTシリーズの発展形である。ただし、現時点で高コストという課題を抱えている。

GPT-4.5は2月27日から、ChatGPT Proプラン(Web/モバイル/デスクトップ)で利用可能となった。検索機能、ファイルや画像のアップロード、Canvas機能に対応する一方、音声モード、動画、画面共有などのマルチモーダル機能は現時点で未対応である。

現在、ChatGPTには従来型(事前学習型)のGPTシリーズと、2024年9月に登場したo1から続く推論強化型の2つの異なるモデルが存在している。

  • 事前学習型: (GPTシリーズ: GPT-4o、GPT-4など): 大量のデータを活用し、知識の網羅性や直感的な理解を強化。汎用的な会話や文章生成に強みを持ち、長文の理解や一貫性のある回答を得意とする。
  • 推論強化型モデル(oシリーズ: o1、o3-miniなど): 即時の回答ではなく、思考プロセスを経て答えを導き出すモデル。数学・科学(STEM)や論理的推論を要する問題の解決に優れる。

GPT-4.5は事前学習型の最新モデルである。最大の特長は、「教師なし学習(Unsupervised Learning)」のスケールアップによる知識の拡張だ。膨大なデータと計算リソースの活用により、知識の網羅性が向上し、より広範なトピックに対応できるようになった。また、モデル構造の最適化やトレーニングプロセスの改良により、知識を効率的に活用する能力も強化され、従来よりも少ない推論時間でより正確な知識を提供可能となった。ハルシネーション(誤情報の生成)の発生率が大幅に低減している。

加えて、GPT-4.5は知識の拡張だけでなく、感情知能(EQ)の向上にも重点を置いている。例えば、ユーザーが失敗や悩みを相談した際、GPT-4.5は単なるアドバイスではなく、ユーザーの気持ちを汲み取った共感や励ましを含めた「より人間らしい」応答を行う。これにより、従来モデルよりも自然で温かみのある会話が可能となった。

OpenAIはGPT-4.5の性能を評価するため、複数のベンチマークテストを実施した。一般的な知識問題を問う「SimpleQA」では、GPT-4oや推論強化型の最新モデル「o3-mini」を上回る精度を達成。事実に基づく質問に対する正確性が向上している。

以下のグラフは、テスターがGPT‑4oよりGPT‑4.5を好んだクエリの割合を示したものである。専門的なクエリ、クリエイティブな対話の両方のケースで、GPT-4.5の微妙なニュアンスの理解力や会話の自然さ、協調性が評価された。

一方、数学や科学分野の高度な問題を扱う「AIME」「GPQA」などのテストでは、推論強化型のo3-mini(high)には及ばなかった。GPT-4.5は「知識の拡張」に重点を置いたモデルであり、ユーザーは用途や目的に応じて、モデルの強みを活かした適切な使い分けが求められる。

GPT-4.5の最大の課題は、高い運用コストである。 OpenAIは「GPT‑4.5は非常に大規模で計算負荷の高いモデルであり、GPT‑4oの代替ではなく、コストもGPT‑4o以上にかかる」と説明している。APIに関しては、Chat Completions API、Assistants API、Batch APIを対象に、有料利用ティアの開発者向けにプレビュー提供されている。ただし、将来については「現在の能力を維持しつつ将来のモデル開発を進める中で、APIでの長期提供を継続するかどうかを検討中」としており、継続的な提供が保証されているわけではない。

OpenAIは、GPT-4.5の知識の拡張と感情知能における良好な成果にもかかわらず、ホワイトペーパーの中で、同モデルをフロンティアモデルとは考えていないと述べている。同社は2025年内に「GPT-5」をリリースする予定で、GPT-5ではGPTシリーズ(事前学習型)とoシリーズ(推論強化型)の統合が計画されている。GPT-4.5は、その過渡期にあたるモデルであり、今後の生成AIモデルの進化を見据えた実験的なリリースとなる可能性もある。OpenAIは「より広範な知識、強化された直感力、そしてEQの向上といったGPT‑4.5の特長を、将来のモデルを通じてすべてのユーザーに提供できるよう取り組む」としている。