深度分析 多代理LLM在陪審團式審議的實驗:RLHF強度如何影響定錨與共識形成 以電影《十二怒漢》為基準,將十二位角色化的大型語言模型置入陪審團討論以評估多代理審議。比較重度與輕度RLHF在三種投票與提示條件下的表現。結果顯示十八次實驗有十七次以懸而未決收場,主要因代理人固守初始立場(anchoring),且對齊強度而非能力決定討論靈活性。