記憶體效率

錯誤門控學習降低能源與記憶體

深度分析

錯誤門控學習：降低持續學習能源與記憶體消耗的生物啟發方法

動物能在不耗盡能量的情況下持續更新內部模型，而傳統人工神經網路在每筆樣本皆進行參數更新。研究提出以分類錯誤為門檻的「錯誤門控學習」，僅在當前或過去的錯誤時才允許突觸調整，更新次數減少 50%~80%。此機制在增量與線上學習情境下，可大幅降低記憶體緩衝需求與能源消耗。

Parcae 迴圈式Transformer記憶體模型效能提升

深度分析

Parcae：穩定迴圈式 Transformer 架構突破記憶體限制

研究背景：隨著推論成本攀升，學界探索在不擴大記憶體佔用下提升模型品質。核心技術：Parcae 以中間迴圈設計，將 Transformer 區塊重複 T 次，同時透過負對角矩陣約束確保系統穩定。主要結果：770M Parcae 的效能相當於 1.3B 傳統 Transformer，且在多項基準測試中均優於固定深度模型。