深度分析 STAR‑PólyaMath:持久元策略與 reasoning‑free 編排器強化多代理數學推理 面對長程數學推理的可靠性挑戰,研究提出STAR‑PólyaMath,透過持久元策略監督與Reasoner‑Verifier結構化互動,並由Python編排器執行回溯與重規劃,有效抑制幻覺累積與記憶碎片化,於多項競賽基準展現領先效能與更高穩定性。