Skip to main content

Agents' Last Exam(ALE)でGPT-5.5が首位 ── Claude Fable 5は55産業ツールベンチマークで敗北

概要

UC Berkeley RDIと300人超の専門家が構築した実務型AIベンチマーク「Agents' Last Exam(ALE)」で、GPT-5.5がClaude Fable 5を上回り首位を獲得した。55の産業分野でプロ仕様のソフトウェア操作を直接課す、極めて実戦的な評価指標だ。

詳細

参照