深度分析
MemTier:在 OpenClaw 外掛下以分層記憶、PPO 檢索權重緩解 BM25 檢索瓶頸
長時運行自主代理常遭遇記憶一致性、檢索與歸因四大失效模式,導致工具執行成功率隨時間下滑。研究提出MemTier——三層記憶架構,包含結構化 episodic JSONL、五信號加權檢索、注意力歸因的認知權重更新、非同步鞏固守護程序與PPO 驅動的檢索權重學習。
深度分析
長時運行自主代理常遭遇記憶一致性、檢索與歸因四大失效模式,導致工具執行成功率隨時間下滑。研究提出MemTier——三層記憶架構,包含結構化 episodic JSONL、五信號加權檢索、注意力歸因的認知權重更新、非同步鞏固守護程序與PPO 驅動的檢索權重學習。
速報
在大型語言模型能力提升下,詞彙檢索能否支撐代理式深度研究?研究以BM25配合更強的LLM並提出Pi-Serini搜尋代理,整合檢索、瀏覽與閱讀三項工具,實驗於BrowseComp-Plus顯示:精心調校的BM25加深度檢索可達高答案準確率與證據回溯率。
深度分析
資訊檢索正從多輪試探式查詢改為以單次專家式檢索應對複雜語意請求。SIRA借助大型模型離線豐富語彙、線上擴展查詢並以經統計驗證的詞項驅動BM25一次檢索。實驗在多項嚴苛基準上顯示檢索品質與下游問答覆蓋顯著提升。方法無需再訓練檢索器,保留可解釋性與低成本優勢。
深度分析
長期運行的自治式代理面臨記憶一致性衰退。MemTier以三層分級記憶、結構化JSONL軼事、五訊號加權檢索與注意力歸因迴路,並用非同步合併守護程序把軼事萃取為語義事實。評測在LongMemEval-S 500題上,語義預填後單次回溯達0.686–0.714,整體Acc提升至0.382、F1=0.412。
深度分析
EnterpriseDocBench 提出一個面向企業文件處理的四軸評測框架:解析(parsing)、索引(indexing)、檢索(retrieval)與生成(generation),並以公開授權的多領域文件語料與半自動 QA 註記流程建構基準。
Mango
面對深層階層網站,從首頁啟動的傳統代理常導致無效探索。Mango先以輕量爬蟲與關鍵詞搜尋構建網站全域結構,再用BM25篩選候選URL,將URL選擇視為多臂賭博機並以ThompsonSampling動態分配預算,並以情節記憶記錄路徑避免重複訪問;在WebVoyager與WebWalkerQA上顯示出明顯成功率提升。
深度分析
面對對話式大模型缺乏持久記憶,研究提出LyzrCognis:以雙儲存層(OpenSearchBM25+向量檢索)與RRF融合,寫入時採語境感知抽取決定新增或更新,加入時間加權與BGE-2重排以強化時序查詢與版本回溯。實驗於LoCoMo與LongMemEval顯著領先。
量子靈感嵌入
本研究針對文件檢索提出量子靈感的 1024 維嵌入表示,透過重疊窗口與多尺度聚合建構,同時加入語意投影與蒸餾機制。實驗發現 BM25 仍為基線,量子嵌入單獨使用時排序不穩,混合檢索可提升效能,顯示其適合作為輔助元件。