步驟同儕優勢

步驟同儕提升多答案召回

深度分析

SPADER：步驟同儕優勢與多樣性探索獎勵提升多答案問答的召回與 F1 表現

隨著大型語言模型被廣泛用於工具增強型代理人，研究聚焦於單一答案的長程推理。本文提出SPADER框架，結合步驟同儕優勢機制與多樣性探索獎勵，提升多答案問答的覆蓋率。實驗顯示在四大基準上召回與F1均優於現有方法。此技術有望提升搜尋助理與知識圖譜建構的完整性，並推動開發者設計更具探索性的AI代理人。

SPADER步驟同儕多樣探索

深度分析

結合步驟同儕優勢與多樣性探索獎勵的 SPADER 框架在多答案問答中的效能提升

隨著大型語言模型被廣泛用於工具增強代理，對於需要多答案的資訊查詢提出了長程搜尋與探索的挑戰。研究提出 SPADER 框架，結合步驟同儕優勢的無評論員信用分配與多樣性導向的探索獎勵，促使代理持續發掘長尾實體。實驗顯示在四大多答案 QA 基準上，召回率與 F1 均優於既有方法。