米Anthropicは6月9日(現地時間)、同社の最上位AIモデルである「Claude Mythos」クラスに属する新モデル「Claude Fable 5」および「Claude Mythos 5」を発表、同日より提供を開始した。両モデルは同一の基盤モデルを共有しており、違いは安全制限と利用対象にある。Mythos 5は承認済みパートナー向けに提供を制限したモデルであり、Fable 5は高度な安全対策(セーフガード)を施した一般向けのモデルである。

Mythosは4月に発表されたAnthropicのフロンティアモデルで、従来の最上位モデルを大きく上回る性能を持つ一方、サイバー攻撃や脆弱性特定などへの悪用リスクがあることから、これまで一般提供は行われず、防御的なサイバーセキュリティ用途に限定したプレビュー提供にとどめられてきた。

Fable 5は一般向けにカスタマイズされたモデルで、サイバーセキュリティ、生命科学・化学、モデル蒸留に関わる高リスクな要求を自動検出する分類器(classifier)が組み込まれている。

分類器がリスクを検知した場合は、自動的に「Claude Opus 4.8」に処理が引き継がれ(フォールバック)、利用者には切り替えが行われたことが通知される。Anthropicによれば、初期データでは通常のセッションにおけるフォールバックの発生率は5%未満にとどまり、95%以上はFable 5の応答で完結した。

同社によると、FableはClaude Opusを上回る性能を持ち、ソフトウェアエンジニアリング、ナレッジワーク、ビジョン、科学研究などほぼ全ての検証ベンチマークで最先端の性能を示した。特に継続的に自律して動作する能力に優れ、タスクが長く複雑になるほど従来モデルとの差が広がるという。

一方、Mythos 5は「Claude Mythos Preview」の後継という位置付けである。セーフガードの一部が解除されており、Project Glasswingに参加するサイバー防衛組織や重要なインフラプロバイダーなど、事前に審査・承認された特定のユーザー向けに提供される。性能面ではMythos Previewと同等か、やや優れている範囲だが、効率性が向上しており、同じタスクで利用料金を大幅に抑えられる。

公式リリースではFable 5とMythos 5による、以下のような成果が報告されている。

  • ソフトウェアエンジニアリング:米決済大手のStripeにおける早期テストでは、5000万行におよぶRubyのコードベース全体の移行作業をわずか1日で完了した。これは、開発チームが手作業で行えば2か月以上かかる規模の業務だという。
  • 金融:Hebbiaのシニアレベル推論向け金融ベンチマークで最高スコアを記録。複雑な文書推論や図表の解釈において大幅な向上が見られた。
  • ビジョン(視覚認識):詳細な科学的図表から正確な数値を抽出できるほか、スクリーンショットのみからウェブアプリのソースコードを再構築することが可能。また、視覚用の最小限のハーネス(補助ツール)のみで、ゲーム「ポケットモンスター ファイアレッド」を自律的にクリアした。
  • 科学・医学研究(Mythos 5による成果):Anthropic社内のタンパク質設計の専門家がMythos 5を活用することで、創薬プロセスの一部を約10倍に加速させた。また、分子生物学分野において新規で説得力のある科学的仮説を一貫して生成し、そのうちの大腸菌タンパク質に関する仮説は、独立した別の研究室の研究によって後に裏付けられた。

サブスクプランでのFable 5 無料提供は6月22日まで

Fable 5は、6月9日から6月22日までPro、Max、Team、およびシートベースのEnterpriseプランに無料で含まれる。6月23日からはこれらのプランから削除され、それ以降の利用には「追加使用量」(利用クレジット)が必要になる。これは現時点でFable 5への需要が高く、かつ予測が困難であるためで、十分な処理能力を確保できればサブスクリプションプランでの提供を再開する方針としている。

Claude APIおよび従量課金制のエンタープライズプランでは9日より利用可能となる。両モデルのAPI料金は、入力100万トークンあたり10ドル、出力100万トークンあたり50ドルで、Mythos Previewの半額以下である。

Glasswingのパートナー企業には、Mythos PreviewのアップグレードとしてMythos 5が展開される。サイバーセキュリティ分野と同様のアクセスプログラムを、まもなく一部のバイオ研究者にも拡大する予定である。