深度分析 「Inclusion‑of‑Thoughts」提升大型語言模型多選題推理穩定性的零樣本方法 研究指出大型語言模型在多選題中易因干擾選項產生偏好不穩定。提出Inclusion‑of‑Thoughts透過自我過濾僅保留可信選項,減少認知負荷。實驗顯示在算術、常識與教育基準上提升數百分點,且計算成本低。相較於自我一致性或大量抽樣,IoT僅需三階段即可穩定預測,預示未來可於AI服務中廣泛部署。