深度分析 SCALAR:在理論物理中以 Actor–Critic–Judge 多回合互動提升 LLM 解題能力 理論物理領域,LLM與代理式AI為研究夥伴。本文提出SCALAR:Actor、Critic、Judge構成的迭代回路,Actor提案、Critic循序回饋、Judge評分。實驗比較不同Actor身份與Critic策略,發現多回合對話優於單次回覆,但成效依賴Actor–Critic配對與回饋風格。