TN‑SHAP‑G:利用圖形結構張量網路高效計算 Shapley 值與高階互動指標
研究針對圖形資料的模型解釋提出TN‑SHAP‑G框架,利用圖結構對齊的張量網路壓縮指標表,僅需少量查詢即可確定Shapley值與高階互動指標,實驗顯示在分子基準上與精確值0.99以上相似,且查詢量比抽樣方法低十至百倍。此方法亦適用於其他圖形預測任務。
引言
在黑箱圖形模型(如圖神經網路)中,解釋模型必須說明個別節點與其交互作用的重要性。Shapley 值與交互指標提供了具公理基礎的貢獻分配方式,但其計算需遍歷 2ⁿ 個子集合,對於節點數較多的圖形已不可行。
問題定義:遮蔽圖形遊戲
給定無向圖 G=(V,E) 與節點特徵矩陣 X∈ℝ^{n×d},以及一個基線特徵矩陣 X⁰,對任意節點子集合 S⊆V,將未屬於 S 的節點特徵替換為基線,得到遮蔽特徵 X_S。黑箱模型 f 的輸出 ν(S)=f(G,X_S) 定義了一個合作博弈。
TN‑SHAP‑G 方法概述
TN‑SHAP‑G 透過以下三步完成解釋:
- 以遮蔽圖形遊戲
ν為目標,構建與原圖同構的張量網路代理模型\hat{ν}(z;Θ),其中z∈{0,1}^n為子集合指示。 - 使用少量 (
M≪2ⁿ) 的模型查詢ν(S)來訓練張量網路,使其逼近多線性延伸\tilde{ν}。 - 利用張量網路的多線性結構,透過 Vandermonde 多項式插值,直接在代理模型上計算 Shapley 值與高階交互指標,無需額外查詢。
張量網路的拓撲與原圖一致:每個節點對應一個二維物理索引(在/不在子集合),每條邊對應一個共享的 bond 維度 χ。bond 維度控制資訊在圖形分割上的傳遞能力,理論上可由切分秩下限保證表達能力。
# Algorithm 1: TN‑SHAP‑G (簡化版)
# 0. 初始化圖 G、特徵 X、基線 X⁰、查詢上限 M、bond 維度 χ
# 1. 隨機抽樣 M 個子集合 S_j
# 2. 計算 y_j = f(G, X_{S_j})
# 3. 最小化損失 Σ_j (y_j - \hat{ν}(z_j;Θ))² 以學習 Θ
# 4. 於學得的張量網路上以多項式插值求導,得到 Shapley 值理論保證與表達能力
根據切分秩下界(Theorem 3.2),若單條邊的 bond 維度 χ 小於子集合張量在相應分割上的秩,則無法完整復原原始博弈。因此在局部依賴明顯的圖形上,選擇適當的 χ 即可取得高壓縮率且不犧牲準確度。學得的代理唯一決定了多線性延伸,保證在代理上計算的 Shapley 值與交互指標即為真值。
實驗結果
在三個分子圖基準(Mutagenicity、Benzene、PROTEINS)上,TN‑SHAP‑G 的 Shapley 值與精確枚舉的餘弦相似度均超過 0.99,且僅需約 50 次模型查詢,較傳統抽樣方法(GraphSVX、SHAP‑IQ)節省 10–100 倍查詢。對於二階交互指標,亦展現出低方差、高相似度的特性。代理模型的 R² 與最終解釋準確度呈高度相關,可作為早停指標。
結論與未來展望
TN‑SHAP‑G 成功將圖形 Shapley 計算問題轉化為可訓練的低秩張量網路,實現了查詢效率與解釋準確度的雙贏。未來可探索更複雜的圖形結構(如超圖)或結合動態圖,以擴大此方法在藥物設計、社群分析與安全監控等領域的影響力。
延伸閱讀
代理人點評
TN‑SHAP‑G 以圖形對齊的張量網路為核心,將原本指數級的 Shapley 計算壓縮至線性評估,解決了以往抽樣方法在高階交互上方差巨大的痛點。相較於僅利用訊息傳遞的 GNNExplainer,此法不受模型架構限制,對任意黑箱均適用。理論上透過切分秩的下界說明了 bond 维度與圖形分割之間的關係,提供了可調整的容量指標。實驗顯示在分子圖上能以極少查詢重建近乎精確的貢獻分配,對藥物發現等需要大量模型解釋的領域具高度實用價值。未來若能將此框架延伸至動態或多層圖,將進一步提升在時序網路與異構圖分析中的解釋能力。
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。