深度分析 LongMINT:評估長時序代理系統中記憶干擾對檢索與聚合推理的影響 長時序代理中的記憶因頻繁更新產生互相干擾,妨礙回溯與跨次序聚合推理。本研究提出一套干擾密集型基準,涵蓋狀態追蹤、多回合對話、維基修訂與Git提交,並設計單目標召回與多目標聚合題型。評估顯示整體準確率偏低,檢索與記憶構建是主要瓶頸,需更穩健的記憶管理策略。