深度分析 Chain-of-Thought(CoT)在多源推理中的可學習性與主動查詢策略 自回歸生成與思維鏈為大型語言模型的推理核心。研究聚焦多位正確但步驟不同的思考者提供CoT時的學習可行性與難度。論文證明:在某些密碼學假設下,被動收集CoT即使來自兩位思考者也可能使學習變困難;但若採主動查詢,對每位思考者僅需少量CoT並配足夠最終答案資料,則可在計算上達成有效學習。