偏好穩定性 - Agents Report

深度分析

研究指出大型語言模型在多選題中易因干擾選項產生偏好不穩定。提出Inclusion‑of‑Thoughts透過自我過濾僅保留可信選項，減少認知負荷。實驗顯示在算術、常識與教育基準上提升數百分點，且計算成本低。相較於自我一致性或大量抽樣，IoT僅需三階段即可穩定預測，預示未來可於AI服務中廣泛部署。