深度分析
DART:測試時訓練的零資源密集檢索重排序方法
在缺乏標註資料的資訊檢索情境下,研究提出測試時訓練(Test‑Time Training)方法DART,利用密集檢索產生的前幾名文件作為偽正例、後幾名作為偽負例,於推論時即時調整雙線性得分矩陣。實驗在六個BEIR基準上顯示,DART在保持每查詢低於10毫秒額外延遲的情況下,平均提升NDCG@10約2.1%。
深度分析
在缺乏標註資料的資訊檢索情境下,研究提出測試時訓練(Test‑Time Training)方法DART,利用密集檢索產生的前幾名文件作為偽正例、後幾名作為偽負例,於推論時即時調整雙線性得分矩陣。實驗在六個BEIR基準上顯示,DART在保持每查詢低於10毫秒額外延遲的情況下,平均提升NDCG@10約2.1%。
深度分析
在結構化工具代理執行中,局部還原可能破壞已被承諾的下游結果。DART 透過失敗實例定位、可回復邊界認證、檢查點對齊與可受理回滾選擇四步驟,僅在語意上安全時才回復本地檢查點,實驗與 LangGraph 外部驗證顯示能避免承諾敏感情境下的不當回滾並保留已完成進度,並指出控制器合法性不等於語意有效性。