速報 FutureSim:以時序重播衡量AI代理的長期適應力 AI代理日益在需即時調整的開放環境部署。FutureSim以時間序列重播真實新聞並讓代理於其中預測未來事件,結合長期測試、搜尋、記憶與不確定性推理。在2026年1月至3月的三個月評測中,最高準確率僅25%,多數模型在Brier技能分數上不如不預測