continual-learning - Agents Report

深度分析

DRIVE：以雙層技能模型分離推理與互動，提升網頁代理的泛化與可執行性

面對動態網頁，DRIVE提出雙層技能架構：以自然語言表達可轉移的推理技能，並以程式化互動技能承接頁面可執行操作。系統根據任務語意與頁面情境檢索並協調兩類技能，並以技能層級反思分別更新庫內條目，有效抑制布局變更導致的執行失敗，平均成功率達52.8%。

深度分析

Functional Task Networks（FTN）：皮質啟發的遮罩式參數隔離與無標籤子網回復

在分塊序列的持續學習挑戰中，研究者提出Functional Task Networks（FTN）：一種受哺乳類大腦皮質結構啟發的參數隔離機制。FTN由大量小但深的獨立「平行神經元」組成，透過三階遮罩配置流程（對連續遮罩做梯度下降、以空間平滑核促成區域聚集、再以top-k二值化固定容量）來建立任務專屬子網絡。

深度分析

Adam 的衰減後自適應失效：診斷與 Adaptive‑OGP 解耦修復

研究發現：多數持續學習方法在上游修改梯度（投影、懲罰式重標定、重放混合）後，仍把修改後訊號同時餵入 Adam 的一階與二階動量，導致在高重疊、無自適應強度調度的任務序列中出現「衰減後自適應（attenuate‑then‑adapt）」的隱性失效。

深度分析

COMPASS：語義採樣與持續PEFT適配器提升多語言模型跨語轉移表現

COMPASS提出一套以資料為中心的多語言適配方法，結合參數高效微調（PEFT）與語義導向取樣，為目標語言訓練輕量語言專屬適配器。方法先用多語嵌入表示將訓練、輔助與評估資料聚類，量化群集間的分布落差，並優先從欠缺語義群集中抽樣輔助資料以補足訓練覆蓋。

深度分析

Emergence Transformer：以 Dynamical Temporal Attention (DTA) 調控動態系統湧現行為

研究聚焦於序列動態中的時間注意力，提出可變時域查詢鍵值的動態時間注意力(DTA)使元件能與自身或鄰居過去狀態互動。neighbor-DTA傾向促進振盪相干，self-DTA則對網路結構呈現非單調最佳化注意力權重。於意見動態與Hopfield聯想記憶示範，DTA可調節共識並支援持續學習。