深度分析 Thought-Tree:以樹狀推理結構預測 LLM 編碼任務正確性 近年大型語言模型在測試時計算資源放大下會生成長且分支的中間推理痕跡,能提升編碼任務表現。本文引入 programmatic 問題生成以控制難度,並提出 thought-tree 的樹狀表示,將推理切分為原子段落並建構階層關係。從 thought-tree 抽取結構與語義特徵後,訓練輕量分類器來預測推理是否導出正確程式輸出。