深度分析
BRANE 與 Query2Conf:查詢級動態配置檢索管線以擴展成本—品質帕累托前緣
知識檢索管線影響答案品質與成本。本文提出Query2Conf與BRANE:以LLM抽取工作負載的二元特徵,為候選管線訓練輕量預測器,推論時以代價—準確度拉格朗日權衡逐查詢選擇配置,實驗在三項基準上擴展成本—品質帕累托前緣,可在目標準確度下節省更多成本。
深度分析
知識檢索管線影響答案品質與成本。本文提出Query2Conf與BRANE:以LLM抽取工作負載的二元特徵,為候選管線訓練輕量預測器,推論時以代價—準確度拉格朗日權衡逐查詢選擇配置,實驗在三項基準上擴展成本—品質帕累托前緣,可在目標準確度下節省更多成本。
速報
在大型語言模型能力提升下,詞彙檢索能否支撐代理式深度研究?研究以BM25配合更強的LLM並提出Pi-Serini搜尋代理,整合檢索、瀏覽與閱讀三項工具,實驗於BrowseComp-Plus顯示:精心調校的BM25加深度檢索可達高答案準確率與證據回溯率。