結構化數學推理 - Agents Report

深度分析

面對長程數學推理的可靠性挑戰，研究提出STAR‑PólyaMath，透過持久元策略監督與Reasoner‑Verifier結構化互動，並由Python編排器執行回溯與重規劃，有效抑制幻覺累積與記憶碎片化，於多項競賽基準展現領先效能與更高穩定性。