深度分析 PathCal:以反思標記類別與狀態感知進行解碼層局部校準 大型推理語言模型常在推理階段生成長篇 chain-of-thought(CoT),反思標記(如“wait”、“but”、“alternatively”)會出現在路徑轉折處,為推理控制提供輕量觸點。