深度分析 四軸對齊框架:LongHorizon-Bench 評估長時程企業 AI 代理人的合規與決策衡量 長時程企業代理人在貸款核保、理賠裁定等場景,必須面對跨文件記憶損耗、多步推理與監管檢視。研究提出一套四軸對齊框架:事實精確(FRP)、推理連貫(RCS)、合規重構(CRR)與適度棄權(CAR),並以 LongHorizon-Bench 在貸款與保險兩域做受控測試。