AIトレンド最前線(3) 7月23日～8月8日の注目AIニュース - 「GPT-5」ついに登場、オープンモデル「gpt-oss」にも注目集まる

今回は、2025年7月22日～8月8日に発表されたAI関連の注目すべきトピックを紹介する。GitHubは自然言語でWebアプリを生成できる「GitHub Spark」のパブリックプレビューを開始した。OpenAIは、最新のAIモデル「GPT-5」を公開したほか、ChatGPTの「学習モード」や、オープンウェイト言語モデル「gpt-oss」を発表した。Anthropicはコーディング性能がさらに向上した「Claude Opus 4.1」をリリースした。

それぞれ詳しく見ていこう。

自然言語の指示でアプリを作れる「GitHub Spark」パブリックプレビュー開始

7月23日、GitHubは自然言語で指示するだけでWebアプリを開発できる「GitHub Spark」のパブリックプレビューを開始した。

GitHub Spark - アイデアを、形にし、リリースしよう。

GitHub Sparkは2024年10月に「GitHub Universe」にて発表されたサービス。ユーザーがダッシュボード上で自然言語を使って作りたいアプリの内容を入力すれば、即座に入力した内容に合ったアプリが自動生成される。コードの生成やビルドといった手順は不要で、すぐに動作可能なアプリが完成する点が大きな特徴で、生成AIサービスの「Claude Sonnet 4」が使われている。

データストレージ、認証、テーマの設定、LLM（大規模言語モデル）の利用、生成したアプリのデプロイなどの環境はすべてGitHub側で管理されるため、事前のセットアップは不要で、生成したアプリは自動的にGitHubリポジトリーに保存されてワンクリックで公開できる。生成されたアプリは、自然言語やUI操作、あるいはコードによる編集が可能で、必要に応じてコーディングエージェントと連携することもできる。

本稿執筆時点で、GitHub Sparkは「Copilot Pro+」のユーザーが利用でき、今後それ以外のユーザーにも対象を拡大していくとのことだ。

GitHub Spark - アイデアを、形にし、リリースしよう。

ChatGPTにユーザーの学習をサポートする「学習モード」登場

7月29日、OpenAIはAIチャットサービス「ChatGPT」に新たに「学習モード」と呼ばれる機能を追加した。これは、ユーザーの質問に対して直接回答を提示するのではなく、理解を深めるためヒントや追加の質問を返すことで、ユーザーが特定のトピックについて学習できるようにするモード（関連記事:ChatGPTに「学習モード」が登場、AIが学びのパートナーに | TECH+（テックプラス））。

学習を開始する前に、学習の目的や現在のスキルレベルなどを細かく設定できるので、ユーザーは自分の理解度に合わせて学習を進められる。OpenAIは、この機能を皮切りにして、AIツールを教育の一部として統合する構想があるという。

OpenAIがオープンウェイトのAIモデル「gpt-oss」発表

8月5日、OpenAIは新たなオープンウエイトのAIモデル「gpt-oss」を発表した。データセンターやハイエンドPC向けの大規模言語モデル（LLM）である「gpt-oss-120b」と、一般向けの中規模モデルである「gpt-oss-20b」の2種類があり、いずれもApache 2.0のライセンスで公開されている（関連記事:OpenAIが商用可能なオープンウエイトモデル「gpt-oss」公開、6年ぶりオープン回帰 | TECH+（テックプラス））。

これらモデルは高性能な推論能力を備えつつ、比較的少ないリソースでも運用可能な点が大きな特徴。gpt-oss-120bは1170億パラメータを持ち、OpenAIの商用モデルである「o4-mini」に匹敵する推論能力を持つ。

gpt-oss-20bは210億パラメーターの軽量モデルで、「o3-mini」と同等の推論能力を持ち、一部ベンチマークではo3-miniを上回るという。gpt-oss-20bは16GBのメモリで動作するので、一般的なPCでも十分に使用できる。

これらのモデルは、計算効率を高めるMoE（Mixture-of-Experts）アーキテクチャを採用しており、タスクごとに必要なパラメータだけを動作させるため、高速かつ効率的な処理を実現する。安全性にも配慮されており、危険性のある学習データを除外したり、プロンプトインジェクション対策が施されている。

OpenAI が提供するオープンモデル｜ OpenAI

Anthropic、「Claude Opus 4.1」を発表

8月6日、AnthropicはAIモデル「Claude Opus 4」の上位互換となる「Claude Opus 4.1」を発表した。Opus 4と比較して、エージェントタスクや実践的なコード生成、推論能力などが強化されており、Anthropicは同社のフラッグシップモデルの新たなマイルストーンとして位置付けている。

Claude Opus 4.1 \ Anthropic

Opus 4.1は実世界の問題に対するコーディング性能を評価するベンチマーク「SWE-bench Verified」において、74.5%の性能を達成。Opus 4の72.5%からは2%の向上、Sonnet 3.7の62.3%と比較すると実に12.2%も高性能な結果となっている。とくに複数ファイルにまたがるリファクタリングやデバッグ精度が大きく改善されているという。

Opus 4.1はClaudeの有料ユーザーとClaude Codeで利用できる。また、API、Amazon Bedrock、Google CloudのVertex AIなどでも、Opus 4と同価格で利用できる。Anthropicは今後数週間のうちに、モデルに大幅な改良を加えたリリースを予定しているという。

SWE-bench VerifiedによるOpus 4.1のベンチマーク結果　出典：Anthropic

OpenAIが最新のAIモデル「GPT-5」を発表

8月7日、OpenAIはAIモデル「GPTシリーズ」の最新版となる「GPT-5」を公式発表した。GPT-5は、数学、科学、金融、法律など多岐にわたる分野において、エキスパートレベルの知見を提供できる新しいフラッグシップモデルとして位置付けられている（関連記事:OpenAI、「GPT-5」を発表 | TECH+（テックプラス））。

GPT-5は、ほとんどの質問に対して素早く回答を返すハイスループットモデルと、より難しい問題に対応する「GPT-5 Thinking」と呼ばれるモデルの、2種類のモデルを搭載している。そして、会話のタイプや複雑さ、ユーザーからの指示に応じて、リアルタイムルーターがどのモデルを使用するかを自動的に判断する。この仕組みによって、応答速度と回答の精度を両立しているのがGPT-5の大きな特徴である。

GPT‑5は文章の執筆や構成において、アイデアを表現力豊かに仕上げる能力を備えている。コーディングでは、複雑なフロントエンドの生成や、大規模なリポジトリのデバッグに対応する。またヘルスケア関連の質問に対しては、これまでのモデルを大きく上回る正確さと安全性の高い回答を生成でき、HealthBenchの評価でも高スコアを獲得したという。