深度分析 用輸出分歧做樣本級路由:MDD、投票與問題重寫在測試時擴展的應用 大型推理模型在數學推理仍會遇到難題,現有測試時擴展耗算力且回報遞減。論文提出以輸出分歧作為不確定性代理,將測試時計算視為個別樣本的策略路由,動態選擇輕量解析、多數投票或重寫重推理。在七個數學基準與數款模型上,該方法在減少採樣成本下提升整體準確度數個百分點。