米Anthropicは5月28日(現地時間)、高性能AIモデル「Claude Opus」の新版となる「Claude Opus 4.8」を発表した。Opus 4.7を基盤に、コーディング、エージェント的なタスク、推論、実務向けの知識作業などで性能を高めたモデルである。
Anthropicは、前世代からの進化として、単純な性能向上に加え、作業中の不確実性や問題点をより明確に示すようになった点を挙げている。根拠が薄いにもかかわらず「作業が進んだ」「タスクが完了した」と主張するような振る舞いを抑え、裏付けのない主張を避けるよう訓練したという。同社によると、Opus 4.8は自身が生成したコードの欠陥を見過ごす可能性が、前世代に比べて約4分の1に低下した。初期テスターからも、分析の入力や出力に含まれる問題を先回りして指摘する傾向が評価されている。
Opus 4.8は、同日からclaude.ai、Claude Code、APIなどで利用できる。通常利用時のAPI料金はOpus 4.7から据え置かれ、100万入力トークンあたり5ドル、100万出力トークンあたり25ドルである。APIでは「claude-opus-4-8」として利用できる。
デフォルト設定は、Anthropicが品質とユーザー体験のバランスが最も高いと判断する「high」である。コーディングタスクでは、Opus 4.7のデフォルト設定と同程度のトークン消費量で、より高い性能を発揮するとしている。難しいタスクや長時間のワークフローでは、さらに高い「extra」または「max」の設定も選択できる。
通常より約2.5倍の速度で動作する「fast mode」の料金が引き下げられた。従来モデルに比べて3分の1の100万入力トークンあたり10ドル、100万出力トークンあたり50ドルで利用できる。
Opus 4.8のリリースと同時に、Claude Code向けに新機能「Dynamic Workflows」がリサーチプレビューとして導入された。大規模なバグ調査、セキュリティ監査、フレームワーク移行など、単一のコンテキストウィンドウには収まらないほど大きなタスクを扱うための機能である。Claudeが全体の計画を立てた後、単一のセッション内で数百のサブエージェントを並列実行し、自らの出力を検証したうえでユーザーに報告する。Anthropicは、Claude CodeとOpus 4.8の組み合わせにより、数十万行規模のコードベース移行を、既存のテストスイートを基準にしながら、着手からマージまで進められる例を挙げている。
また、claude.aiとClaude Coworkに「effort control」が追加された。モデル選択と並んで、Claudeにどの程度の思考量を割り当てるかを選べる機能である。高い設定では、より深く思考して高品質な応答を返す。低い設定では応答が速くなり、レート制限の消費も緩やかになる。
数週間中にMythos級のモデルを展開
Anthropicは今後について、Opusに近い能力をより低コストで提供するモデルに加え、Opusを上回る知能を持つ新クラスのモデルの投入を進める方針を示した。
同社は現在、一部の組織に対し「Claude Mythos Preview」をサイバーセキュリティ用途で限定的に提供している。こうした高度な能力を持つモデルの一般提供には、より強力なサイバー安全対策が必要だとしている。Anthropicは、そうしたセーフガードの開発を迅速に進めており、今後数週間以内にMythos級のモデルを顧客に提供できる見通しだとしている。


