公平性審計

大型語言模型房貸激活層

深度分析

大型語言模型（LLM）在房貸審核：內部表徵、跨層激活導引與因果可利用性分析

研究以配對房貸範例與激活導引檢視指令調校大型語言模型的隱性族群表徵是否具因果影響。研究同時測試跨層干預、激活導引與參數效率微調的可被利用性。結果發現模型輸出表面公平但內部表徵被放大且可操控，且存在方向性不對稱，顯示僅看輸出不足以保障金融決策公正。

XAI 評估視覺語言跨域公平

視覺語言模型

FAIR_XAI：以 XAI 評估視覺語言模型在 AFAR-BSFT 與 E-DAIC 的公平性與跨域表現

臨床福祉評估正快速採用多模態視覺語言模型。研究提出FAIR_XAI框架，結合可解釋性介入與公平性規則，設計零樣本生成式與嵌入式融合兩種管線。作者在實驗資料集間比較模型效能與族群差異，發現績效跨領域波動顯著，XAI能提升程序一致性但不保證結果公平。