深度分析 APPS 以未來價值因子與動態粒子分配優化 LLM 推理效能 研究指出,透過未訓練的輔助粒子功率抽樣 (APPS),在有限運算下可更有效搜尋模型內已有的正確解序列,實驗顯示在 MATH、HumanEval 與 GPQA 三項基準上提升通過率,且具可調粒子數的記憶與計算優勢。此方法將未來價值作為選擇潛能,並支援動態粒子分配,預示未來大型模型在長期記憶與代理人應用上可能減少微調需求。