米Anthropicは2月5日(現地時間)、同社の最上位AIモデルの新版「Claude Opus 4.6」を発表した。複数エージェントを前提としたコーディング支援を強化、Opus系として初めて最大100万トークンのコンテキスト長(ベータ版)に対応している。5日より、claude.ai、API、およびClaudeを利用可能な各種クラウドプラットフォームで提供を開始する。

AIモデルにはコンテキスト長の制約があり、その枠が小さいと会話や処理が長くなるにつれて情報検索能力や精度が低下する「コンテキストロット(context rot:文脈の劣化)」が生じる場合がある。今回、コンテキスト長が従来の最大20万トークンから同100万トークンへ拡張されたことで、より大規模なデータを分割せずに扱えるようになった。これにより、大規模コードベースでの信頼性が向上し、複雑な業務プロセスを一気通貫で処理できるほか、マルチエージェント運用の効率向上も期待される。

Anthropicによると、超長文コンテキストにおける情報検索精度を測る指標「MRCR v2」において、Opus 4.6は前身モデルを大きく上回る76%のスコアを記録した。

  • 最大100万トークンに対応し、「MRCR v2」 のスコアが向上。ただし、「大きければ大きいほど良い」というわけではなく、スケールによる精度減衰というトレードオフもある

    最大100万トークンに対応し、「MRCR v2」 のスコアが向上。ただし、「大きければ大きいほど良い」というわけではなく、スケールによる精度減衰というトレードオフもある

また、「エージェント・チーム(agent teams)」という新たなエージェント機能をリサーチプレビューとして導入した。一つの大きな課題に対して、複数のAIエージェントが自律的に役割を分担(フロントエンド担当、移行担当など)し、並行して作業を進める。エージェントが直接連携し、チームとして自律的に機能させる仕組みである。

開発用途にとどまらず、一般的なオフィス業務においてもClaudeの活用が広がっている。Opus 4.6の改善は、文書作成や調査、財務分析、スプレッドシートやプレゼンテーション作成といった用途で効果を発揮する。「Cowork」においても、こうしたスキルが活用されるとしている。Excel連携では、構造化されていないデータを扱う能力が向上したほか、リサーチプレビューとして「Claude in PowerPoint」(ベータ)をリリースした。

APIを通じて利用する開発者向けには、推論の深さとコスト、速度のバランスを調整する仕組みを拡充した。状況に応じて推論の深さを自動調整する「Adaptive thinking」、推論強度を4段階で指定できる「Effort」、会話が長期化した際に古い文脈を要約して置き換える「Context compaction(ベータ)」などを提供する。出力は最大12万8000トークンまで対応し、大規模な生成物も分割せずに出力しやすくした。

API(claude-opus-4-6)価格は、100万トークンあたり入力5ドル/出力25ドルで据え置いた。20万を超える入力トークンについては、100万トークンあたり入力10ドル/出力37.5ドルのロングコンテキスト価格が適用される。