深度分析
錯誤門控學習:降低持續學習能源與記憶體消耗的生物啟發方法
動物能在不耗盡能量的情況下持續更新內部模型,而傳統人工神經網路在每筆樣本皆進行參數更新。研究提出以分類錯誤為門檻的「錯誤門控學習」,僅在當前或過去的錯誤時才允許突觸調整,更新次數減少 50%~80%。此機制在增量與線上學習情境下,可大幅降低記憶體緩衝需求與能源消耗。
深度分析
動物能在不耗盡能量的情況下持續更新內部模型,而傳統人工神經網路在每筆樣本皆進行參數更新。研究提出以分類錯誤為門檻的「錯誤門控學習」,僅在當前或過去的錯誤時才允許突觸調整,更新次數減少 50%~80%。此機制在增量與線上學習情境下,可大幅降低記憶體緩衝需求與能源消耗。
深度分析
研究背景:隨著推論成本攀升,學界探索在不擴大記憶體佔用下提升模型品質。核心技術:Parcae 以中間迴圈設計,將 Transformer 區塊重複 T 次,同時透過負對角矩陣約束確保系統穩定。主要結果:770M Parcae 的效能相當於 1.3B 傳統 Transformer,且在多項基準測試中均優於固定深度模型。