速報
I-POMDP 與 ToM-2:讓代理人偵測並回應使用者對其知識的錯誤認知
人與代理人互動常因雙方對彼此知識的錯誤判斷而受阻。本研究以 I-POMDP 框架實作第二階理論心智(ToM-2),讓代理人能模擬使用者對代理人知識的錯誤信念,並推估這些信念源自的認知偏誤與捷思法(CBH)。透過辨識何時出現認知偏誤,代理人能產生調整性的回饋來補償誤解,改善當下互動並提升未來教學或協作的品質。
速報
人與代理人互動常因雙方對彼此知識的錯誤判斷而受阻。本研究以 I-POMDP 框架實作第二階理論心智(ToM-2),讓代理人能模擬使用者對代理人知識的錯誤信念,並推估這些信念源自的認知偏誤與捷思法(CBH)。透過辨識何時出現認知偏誤,代理人能產生調整性的回饋來補償誤解,改善當下互動並提升未來教學或協作的品質。
深度分析
研究探討目標僅部分一致的人機互動。採用大規模LLM模擬與平行人類實驗,操控AI透明度與適應性並考量外向性與宜人性兩項人格,分析對談表現與決策結果。主要發現為模擬中人格影響居多,真實使用者則以AI屬性尤其透明度影響最大,帶來溝通與信任的設計權衡。
生成式AI
前 Apple 工程師推出名為 Button 的 AI 硬體裝置,外型酷似 iPod Shuffle。該裝置主打隱私與即時回應,僅在按下按鈕時啟動 AI 聊天機器人,旨在提供比手機更便捷的 AI 互動體驗,定位為手機的補充設備而非替代品。
A-MBER
AI 助手若要真正擬人化,必須能理解使用者的情感演變。新發表的 A-MBER 基準測試專注於評估 AI 是否能將長期記憶與當前情感識別結合,要求模型從多場對話歷史中找出關鍵證據來解釋使用者現在的心情,填補了現有情感分析與長文本記憶測試之間的空白。