深度分析
量化推理冗餘:大型語言模型在長度無關獎勵下的過度思考分析
本報導改寫自 arXiv 研究,針對具推理能力的大型語言模型(LLM)揭示一個普遍現象:模型在解題時產生大量可削減的「尾端思考」。作者提出以「逐步截斷前綴」的實驗定義,把模型自身作為判定器:從一個正確的長序列中,逐步保留前 k 個段落並強制模型立即輸出答案,找出最小能保證正確的 k 值,進而定義步級與字級冗餘比例。
深度分析
本報導改寫自 arXiv 研究,針對具推理能力的大型語言模型(LLM)揭示一個普遍現象:模型在解題時產生大量可削減的「尾端思考」。作者提出以「逐步截斷前綴」的實驗定義,把模型自身作為判定器:從一個正確的長序列中,逐步保留前 k 個段落並強制模型立即輸出答案,找出最小能保證正確的 k 值,進而定義步級與字級冗餘比例。
深度分析
本研究以簡化的序列選擇模型,檢視演算法決策在短期與長期對群體公平與效用的影響。作者提出短期與長期的群體公平度定義,並以「公平成本(Price of Fairness, PoF)」衡量為公平而放棄效用的代價。理論結果指出:短期內,強制靜態公平約束可能導致高昂的效用損失,且在群體分布相近時仍可出現大幅 PoF;