大型語言模型解讀個人感測資料的「認知過度」風險(Epistemic Overreach)
研究檢視大型語言模型在解讀個人感測資料時的證據過度主張問題。以三組大學生長期感測資料、三款模型與兩種提示生成大量解釋,並以結構化量表評估因果主張、資料缺口、過度自信等面向。結果顯示模型常在證據不足下推斷原因,有限提示能減緩但無法徹底消除風險。
LLMs在個人感測解釋上的證據風險
大型語言模型在把行為、睡眠與情緒等感測痕跡轉成自然語言解釋時,常會表現出看似合理但超出資料支持範圍的推論。這篇研究把這種現象定義為「認知過度」(epistemic overreach,EO),並系統性衡量其發生型態。
研究團隊取自三組大學生的長期感測資料集(StudentLife、GLOBEM、CollegeExperience),針對活動、睡眠與情緒異常日產生大量解釋,使用多款模型與兩種提示條件,比較模型在不同證據量下的表現。研究以結構化量表把EO拆成五個面向:缺乏支持的因果歸因、未說明的資料缺口、過度自信語氣、時間不一致性與診斷式推論,逐一評估。
結果發現,模型經常在證據不足時直接歸因異常日的原因;這一模式跨資料集、異常類型與模型家族均有重複出現。增補上下文資訊並不穩定地降低EO,而明確要求模型限制主張的提示雖能緩解部分問題,卻無法根除風險。研究因此主張,在個人感測解釋系統中,證據基礎應成為與流暢性、合理性並列的首要評估準則;系統必須明確區分觀察到的事實、合理推論的部分及尚未確定的資訊。
延伸閱讀
- 模型合併新架構:C2M3、TSV 與 MERGE3 將已學習能力直接組合
- LEAP:在蒸餾訓練中導入早停感知以恢復嵌入模型延遲優勢
- Caracal:以多頭傅立葉(MHF)與頻域因果遮罩實現長序列 O(L log L) 全局混合
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。