majority-voting - Agents Report

深度分析

大型推理模型在數學推理仍會遇到難題，現有測試時擴展耗算力且回報遞減。論文提出以輸出分歧作為不確定性代理，將測試時計算視為個別樣本的策略路由，動態選擇輕量解析、多數投票或重寫重推理。在七個數學基準與數款模型上，該方法在減少採樣成本下提升整體準確度數個百分點。