概念啟動向量(CAV)不穩定性檢視與α‑TCAV的機率化校準
研究發現概念啟動向量(CAV)與TCAV測試具高度隨機性。作者推導主要CAV變種的分布,指出標準TCAV分數依賴不連續指示函數,導致變異不衰減。提出α‑TCAV,用參數化平滑函數取代指示符,建立機率化框架並提出具體調參建議以改善效率與校準。
關鍵速報:從不穩定到機率化校準
研究指出,概念啟動向量(CAV)與TCAV方法在現實應用中呈現高度隨機性。作者系統性推導了主要CAV類別(例如PatternCAV、FastCAV以及基於脊回歸的CAV)的統計分布,並發現一項根本性問題:標準TCAV對於概念影響的評分仰賴不連續的指示函數,這會在某些關鍵情境下維持高變異而不衰減,削弱結果可信度。
為了修正這個缺陷,提出α‑TCAV,一個以參數化平滑函數替代不連續指示的通用框架。此框架將TCAV與Multi‑TCAV納入統一的機率化表述,並導出各種敏感度分數的誘導分布。基於理論分析,作者提供實務性調參建議:可用適當參數在大幅降低計算成本下模擬Multi‑TCAV,或選定參數以達到貝氏最適的校準估計。
最後,研究對常見實務程序提出挑戰性建議,最顯著者包括將整個抽樣預算投入單一CAV而非分散於多個CAV,以換取更穩定的估計。整體而言,這份工作為概念導向的可解釋性方法帶來重要的理論基礎與操作指引,對想要在模型解釋中取得更穩健結論的研究者與工程師具參考價值。
延伸閱讀
- 以 DINOv2 激活與穩定稀疏自編碼器重構 32,000 個視覺概念:Minkowski 幾何視角
- EΔ-MHC-Geo Transformer:以資料驅動Cayley旋轉與Householder反射實現精確正交殘差
- HilbNets:基於Hilbert纖維束的Sheaf Laplacian頻域濾波與離散收斂
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。