深度分析 以 Open Agent Leaderboard 與 Exgentic 評估通用代理:成本、效能與復原路徑 本研究建立開放代理排行榜,以Exgentic為基礎對通用代理在六類真實任務中做統一評測,同時報告品質與成本。方法強調衡量完整系統包含規劃、記憶、工具使用與錯誤復原,結果顯示代理設計與工具選擇會顯著影響性能與費用,並發現一般化代理在多領域已能與專用系統相抗衡。