深度分析 CAP-CoT:以週期式對抗提示強化 Chain-of-Thought 的穩定性與魯棒性 CAP-CoT提出一種週期式對抗提示優化框架,透過三個角色──解題器、對抗挑戰者與回饋代理──在同一模型上反覆對比正確與有誤的推理鏈,將差異轉為逐步、對齊的提示修正。系統循環性地更新解題器提示以修補薄弱步驟,同時讓挑戰者生成愈來愈具診斷性的錯誤,使負樣本隨模型改進而持續有用。