position-bias - Agents Report

深度分析

研究檢視Chain-of-thought推理與R1類推理模型在選擇題的選項位置偏誤。作者以多個推理設定與資料集分析軌跡長度與偏誤關係，並以截斷實驗驗證因果性。結果顯示推理軌跡越長，位置偏誤越高且在大模型上仍有殘存，提示評測流程需考量此機制。