I-POMDP 與 ToM-2:讓代理人偵測並回應使用者對其知識的錯誤認知
人與代理人互動常因雙方對彼此知識的錯誤判斷而受阻。本研究以 I-POMDP 框架實作第二階理論心智(ToM-2),讓代理人能模擬使用者對代理人知識的錯誤信念,並推估這些信念源自的認知偏誤與捷思法(CBH)。透過辨識何時出現認知偏誤,代理人能產生調整性的回饋來補償誤解,改善當下互動並提升未來教學或協作的品質。
代理人能偵測並回應人的錯誤認知
代理人若能辨識人對其知識的錯誤想法,就能針對性地提供回饋,改善互動品質。本研究採用 I-POMDP 作為第二階理論心智(ToM-2)的形式化框架,賦予代理人模擬使用者心目中對代理人知識的演變。
方法上,代理人不只建模自己的知識狀態,也推斷使用者如何基於認知偏誤與捷思法(CBH)形成錯誤信念。當模型偵測到這類偏誤可能在互動中發生時,系統會產生調整性的回饋,目的是補償或澄清使用者的誤解,從而提升當下行為的資訊性與溝通效果。
研究透過實地使用者研究驗證,具 ToM-2 能力的學習代理人,使教師類型的行為變得更具資訊性;受試者主觀上也傾向認為這類回饋較為有用。結論指出,將第二階心智模型整合進代理人,能在考量人類認知偏差下,提供更具情境敏感度與適應性的互動策略,對教學與人機協作場景具有實務價值。
延伸閱讀
- 多代理LLM在陪審團式審議的實驗:RLHF強度如何影響定錨與共識形成
- Truth or Tribe:LLM人格代理、TDR與TC揭示身分偏誤機制
- 階層化多重人物歸納與證據追溯:以意圖記憶與 DPO 優化人物品質
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。