深度分析 Stackelberg 語者:以強化學習提升社交推理遊戲說服性對話 在社交推理遊戲中,成功不只靠正確推理,更需說服他人。研究將回合對話建模為 Stackelberg 競爭,利用強化學習優化發言。實驗證明新代理人在說服力與勝率上均顯著優於基線,暗示此技術可擴展至廣泛的說服性應用。