速報持續學習 Hessian頻譜崩潰神經張量核正則化

深度神經網路塑性喪失與Hessian頻譜崩潰：持續學習新突破

本研究探討深度神經網路在持續學習情境下為何會失去塑性，導致無法在不重新初始化參數的情況下學習新任務。作者發現，新任務初始化時會出現Hessian頻譜崩潰，意味著有意義的曲率方向消失，梯度下降失效。

02 6月 2026 — 2 min read

背景說明

持續學習要求模型在不遺忘舊任務的同時，仍能有效吸收新任務的知識。許多深度神經網路在面對新任務時，需要重新初始化參數，顯示出塑性喪失的問題。

研究發現，塑性喪失前會出現Hessian頻譜崩潰，即在新任務初始化時，有意義的曲率方向消失，使得梯度下降變得無效。透過對線性化ReLU網路的分析，作者推導出ε‑rank條件，說明何時訓練能成功。

作者證明，損失加權的Gram矩陣在譜上等價於廣義Gauss‑Newton近似，將神經張量核（NTK）動力學與Hessian曲率直接關聯。

針對頻譜崩潰，研究討論了Hessian的Kronecker分解近似，進一步提出兩項正則化策略：1. 維持高有效特徵秩；2. 加入L2懲罰。

在多項持續監督與強化學習任務上，結合上述兩項正則化後，模型顯著保留了對新任務的塑性，避免了重新初始化的需求。

原始來源：ArXiv AI

系統聲明：本文的深度點評與首圖視覺，皆為 AI 代理人獨立運算生成。機器視角偶有偏差，請輔以人類智慧進行交叉驗證。

釣魚郵件是持續存在的網路安全威脅，機器學習分類器廣泛用於偵測。一項研究比較 TF-IDF 邏輯迴歸與 DistilBERT 模型，兩者在乾淨資料上準確率超過 98%，但在對抗攻擊下分別跌至 64.00% 與 63.64%。結果顯示乾淨資料準確率無法預測對抗穩健性。

CODENS 是一套將程式碼變更轉化為持續更新、可查詢文件知識庫的系統，專為 Ruby on Rails 生產環境設計。

一項新研究提出了一種名為 PSAP（Polynomial-Sensitivity-Aware Pruning）的結構化剪枝方法，旨在提升同態加密（HE）下神經網路推論的可靠性。

研究發現獨立AI代理人模擬人群時，85%的單元因傾向預設模式而崩塌。口頭抽樣（VS）技術可將忠實度提升6.8-10.1點，但會導致過度分散。調查忠實度在行為任務中僅部分轉移，且「情境無感」指標實為設計缺陷。研究建議採用分布優先策略並搭配預算感知路由器。