Scale AIとThe Center for AI Safety(CAIS)は1月24日、新しいAIベンチマーク「Humanity’s Last Exam」を発表した。直訳するなら「人類最後の試験」。「人類の専門的知識の最前線でAIの知識を試す」としている。Scale AIはAIツール、アプリケーションの構築ツールを開発しており、CAISは2022年設立のAI安全性研究組織だ。
掲載日
更新日
Scale AIとThe Center for AI Safety(CAIS)は1月24日、新しいAIベンチマーク「Humanity’s Last Exam」を発表した。直訳するなら「人類最後の試験」。「人類の専門的知識の最前線でAIの知識を試す」としている。Scale AIはAIツール、アプリケーションの構築ツールを開発しており、CAISは2022年設立のAI安全性研究組織だ。
OpenAIが製品ロードマップ刷新、GPT-5を数カ月内にリリース - o3単独展開は中止
世界のプログラミング言語 第57回 シンプル・高速・保守性の高さを目標に掲げたV言語はGo言語のライバルになり得るか?!
くら寿司流のDXで世界一のレストランに、DX部門が売上や集客増に貢献する仕組みとは?
Windows 11へのアップグレード要件チェック回避を無効化か、Microsoft
スタンフォード大など、50ドル未満のコストでOpenAI o1レベルのモデルを開発
開発/エンジニア システムやソフトウェアの開発に携わるエンジニアに向けた最新情報など仕事に役立つ話題などを提供していきます。