深度分析 T-STAR 框架:將推理路徑轉化為認知樹,解決 AI 代理人獎勵稀疏問題 針對 AI 代理人在複雜推理中面臨的獎勵稀疏挑戰,T-STAR 框架提出將推理路徑由「鏈」轉化為「樹」,透過認知樹結構與手術式策略優化,精確定位關鍵錯誤並修正推理行為,顯著提升 LLM 在多輪對話與長鏈推理任務中的表現。