因果神經機率電路提升概念瓶頸模型可干預性與準確度
概念瓶頸模型(CBM)透過在神經網路中加入概念層,使最終分類結果可解釋且支援專家在測試時修正概念值。然而傳統 CBM 只會覆寫被修正的概念,忽略概念間的因果關係,導致干預效果受限。研究者提出因果神經機率電路(CNPC),結合神經屬性預測器與由因果圖編譯的機率電路,實現精確且可計算的因果推論,保留概念間的依賴。
背景說明
概念瓶頸模型(Concept Bottleneck Models,簡稱 CBM)在端到端神經網路中加入概念層,使得最終分類結果可以由概念預測推導,提升模型可解釋性與可干預性。傳統 CBM 允許領域專家在測試時更正錯誤的概念值,但僅會覆寫被更正的概念,忽略概念之間的因果依賴,可能限制干預效益。
新方法:因果神經機率電路(CNPC)
CNPC 將神經屬性預測器與從因果圖編譯而成的機率電路結合。該電路能在干預時執行精確且可計算的因果推論,天然遵守概念間的因果結構。干預時,CNPC 以專家融合(Product of Experts, PoE)的方式,將屬性預測器的預測分佈與電路計算出的干預邊際分佈結合,產生最終的類別分佈。
理論分析
研究者對 CNPC 的組合干預誤差進行了理論刻畫,說明了模型各模組對誤差的貢獻,並指出在電路正確編譯且屬性預測器足夠準確的條件下,CNPC 能緊密逼近真實的干預類別分佈。
實驗驗證
在五個公開基準資料集(包括內部與外部分布)上,CNPC 與五種現有基線模型比較。結果顯示,無論干預屬性數量多少,CNPC 在任務準確率上皆優於其他模型,證實了其在因果干預情境中的效能提升。
延伸閱讀
- TruthMarketTwin:以 LLM 代理與 GPT-4o 模擬電商評價與保固治理
- MolTrust 協議:以 W3C DID 與 Verifiable Credentials 建構去中心化 AI 代理人信任層
- 基礎模型多代理生成追溯:符號編年誌技術與實驗結果分析
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。