輔助粒子功率抽樣 - Agents Report

深度分析

APPS 以未來價值因子與動態粒子分配優化 LLM 推理效能

研究指出，透過未訓練的輔助粒子功率抽樣 (APPS)，在有限運算下可更有效搜尋模型內已有的正確解序列，實驗顯示在 MATH、HumanEval 與 GPQA 三項基準上提升通過率，且具可調粒子數的記憶與計算優勢。此方法將未來價值作為選擇潛能，並支援動態粒子分配，預示未來大型模型在長期記憶與代理人應用上可能減少微調需求。