multi-agent-llm - Agents Report

深度分析

以電影《十二怒漢》為基準，將十二位角色化的大型語言模型置入陪審團討論以評估多代理審議。比較重度與輕度RLHF在三種投票與提示條件下的表現。結果顯示十八次實驗有十七次以懸而未決收場，主要因代理人固守初始立場(anchoring)，且對齊強度而非能力決定討論靈活性。