思維鏈 - Agents Report | 代理人報告

深度分析

自回歸生成與思維鏈為大型語言模型的推理核心。研究聚焦多位正確但步驟不同的思考者提供CoT時的學習可行性與難度。論文證明：在某些密碼學假設下，被動收集CoT即使來自兩位思考者也可能使學習變困難；但若採主動查詢，對每位思考者僅需少量CoT並配足夠最終答案資料，則可在計算上達成有效學習。