Agents' Last Exam（ALE）でGPT-5.5が首位 ── Claude Fable 5は55産業ツールベンチマークで敗北

概要

UC Berkeley RDIと300人超の専門家が構築した実務型AIベンチマーク「Agents' Last Exam（ALE）」で、GPT-5.5がClaude Fable 5を上回り首位を獲得した。55の産業分野でプロ仕様のソフトウェア操作を直接課す、極めて実戦的な評価指標だ。

出典: https://xenospectrum.com/agents-last-exam-benchmark-gpt-5-5-beats-claude-fable-5/
はてなブックマーク ITホットエントリー（2026年6月13日）