Anthropicは6月9日(現地時間)、一般の使用にも安全に対応できるというMythos級AIモデル「Fable 5」をClaude向けに公開した。入力トークン100万個あたり10ドル、出力トークン100万個あたり50ドルで提供され、6月22日まではPro、Max、Team、SeatベースのEnterpriseプランに限って追加料金なしで利用できる。

  • Anthropic「Claude Fable 5」発表。Mythos級の性能ながら、危険なクエリをOpus 4.8に代替させて安全を確保へ

    Anthropic「Claude Fable 5」発表。Mythos級の性能ながら、危険なクエリをOpus 4.8に代替させて安全を確保へ

Claudeで利用できるモデルに「Fable 5」が加わったという内容。Anthropicが開発したMythosの民生版に位置づけられるモデルで、不適切な利用を検知すると別のモデルに代替して応答することで安全性を高めたとしている。あわせてMythos 5も発表されており、米国政府と協力したProject Glasswing参加グループではアップグレードとして利用できるようになる。

  • 主要モデルとの比較

    主要モデルとの比較

Fable 5はこれまで提供してきたOpue 4.8のモデルに加え、Mythos Previewよりもさらに高い性能を実現。競合するGPT 5.5やGemini 3.1 Proよりもエージェントコーディング能力を含むさまざまなテストで高い指標を達成したとしており、ビジョンテストにおいてはポケモン(ファイアレッド)を追加情報なしでクリアしたデモが公開されている。

  • 高品質な本番コードベースの基準を満たしつつ、難しいコーディングタスクをクリアできるかをテストするCognitionのFrontierCode評価

    高品質な本番コードベースの基準を満たしつつ、難しいコーディングタスクをクリアできるかをテストするCognitionのFrontierCode評価

  • エージェントコーディング能力でもたモデルを圧倒する

    エージェントコーディング能力でもたモデルを圧倒する

  • 自動アライメント評価による全体的な行動の不整合レベル。ほぼOpus 4.8並としている

    自動アライメント評価による全体的な行動の不整合レベル。ほぼOpus 4.8並としている

Fable 5では高い性能が攻撃力として転用されることを防ぐべく、複数の安全策を講じている点もポイント。サイバーセキュリティ、生物学・化学におけるタスクをOpue 4.8で代替して危険な応答を返さないようになっている。さらに他のAIモデルを訓練するために行われる蒸留も検知できるとしており、他のモデルをFable 5級に危険なものに強化しようとする試みにも対処。Fable 5に対して巧妙なコミュニケーションを図ることで安全策を無効化する“脱獄”に対しても、1,000時間以上のテストに耐える強靭性を備えたとしている。

  • 脆弱性検知タスクを検出し、拒否するFable 5

    脆弱性検知タスクを検出し、拒否するFable 5

  • Opus 4.8よりも脱獄に対して圧倒的に高い体制を実現した

    Opus 4.8よりも脱獄に対して圧倒的に高い体制を実現した