深度分析
重正化群映射全連接深度神經網路訓練過程:理論與可解釋性分析
本研究探討全連接深度神經網路的可解釋性,將其訓練過程等同於統計物理的重正化群,針對指數族連續分布進行推導,證明最佳化後的特徵層參數即為RG固定點,此結果不僅驗證了先前在一維Ising模型上的等價性,也為未來將RG概念應用於更複雜的實際資料提供理論基礎。
深度分析
本研究探討全連接深度神經網路的可解釋性,將其訓練過程等同於統計物理的重正化群,針對指數族連續分布進行推導,證明最佳化後的特徵層參數即為RG固定點,此結果不僅驗證了先前在一維Ising模型上的等價性,也為未來將RG概念應用於更複雜的實際資料提供理論基礎。
速報
面向真實決策的AI工具必須能建立可解釋的模擬模型並支援人類專業互補。BEAMS倡議以開放數位與組織基礎設施協作評估建模與模擬工具。評估實作多項自動化測試含因果轉譯、模型迭代、因果推理、合規、模型行為說明與建模建議。結果顯示此類工具在討論與定性任務表現優於因果推理與定量錯誤修正。
深度分析
本篇系統性回顧匯整337篇關於Transformer語言模型(TLMs)對句法知識評估的研究,包含1,015項模型結果。作者分析方法類型(行為、探針、機制),揭示研究過度集中於英語與少數模型(如BERT),且模型在形式句法現象表現相對穩健,但在語法—語意交界(例如指代綁定、filler–gap)上表現較弱且變異大。
速報
面對大型語言模型與人類創作愈加難以區分的挑戰,研究團隊提出 READER,一款強化推理的 AI 文本檢測器。READER 透過一套名為 READ 的監督理由集進行微調,使模型在判斷前先生成結構化理由,再輸出人類或 AI 的判定結果。此設計同時將可解釋性納入決策流程,讓檢測結果不只給出標籤,也能說明依據。
速報
研究發現概念啟動向量(CAV)與TCAV測試具高度隨機性。作者推導主要CAV變種的分布,指出標準TCAV分數依賴不連續指示函數,導致變異不衰減。提出α‑TCAV,用參數化平滑函數取代指示符,建立機率化框架並提出具體調參建議以改善效率與校準。