Scale AIとThe Center for AI Safety(CAIS)は1月24日、新しいAIベンチマーク「Humanity’s Last Exam」を発表した。直訳するなら「人類最後の試験」。「人類の専門的知識の最前線でAIの知識を試す」としている。Scale AIはAIツール、アプリケーションの構築ツールを開発しており、CAISは2022年設立のAI安全性研究組織だ。

人類の知識と推論の最前線でモデルの能力を試す

この記事は
Members+会員の方のみ御覧いただけます

ログイン/無料会員登録

会員サービスの詳細はこちら