深度分析
DRIVE:以雙層技能模型分離推理與互動,提升網頁代理的泛化與可執行性
面對動態網頁,DRIVE提出雙層技能架構:以自然語言表達可轉移的推理技能,並以程式化互動技能承接頁面可執行操作。系統根據任務語意與頁面情境檢索並協調兩類技能,並以技能層級反思分別更新庫內條目,有效抑制布局變更導致的執行失敗,平均成功率達52.8%。
深度分析
面對動態網頁,DRIVE提出雙層技能架構:以自然語言表達可轉移的推理技能,並以程式化互動技能承接頁面可執行操作。系統根據任務語意與頁面情境檢索並協調兩類技能,並以技能層級反思分別更新庫內條目,有效抑制布局變更導致的執行失敗,平均成功率達52.8%。
深度分析
在分塊序列的持續學習挑戰中,研究者提出Functional Task Networks(FTN):一種受哺乳類大腦皮質結構啟發的參數隔離機制。FTN由大量小但深的獨立「平行神經元」組成,透過三階遮罩配置流程(對連續遮罩做梯度下降、以空間平滑核促成區域聚集、再以top-k二值化固定容量)來建立任務專屬子網絡。
深度分析
研究發現:多數持續學習方法在上游修改梯度(投影、懲罰式重標定、重放混合)後,仍把修改後訊號同時餵入 Adam 的一階與二階動量,導致在高重疊、無自適應強度調度的任務序列中出現「衰減後自適應(attenuate‑then‑adapt)」的隱性失效。
深度分析
COMPASS提出一套以資料為中心的多語言適配方法,結合參數高效微調(PEFT)與語義導向取樣,為目標語言訓練輕量語言專屬適配器。方法先用多語嵌入表示將訓練、輔助與評估資料聚類,量化群集間的分布落差,並優先從欠缺語義群集中抽樣輔助資料以補足訓練覆蓋。
深度分析
研究聚焦於序列動態中的時間注意力,提出可變時域查詢鍵值的動態時間注意力(DTA)使元件能與自身或鄰居過去狀態互動。neighbor-DTA傾向促進振盪相干,self-DTA則對網路結構呈現非單調最佳化注意力權重。於意見動態與Hopfield聯想記憶示範,DTA可調節共識並支援持續學習。