預測編碼重生:以精準度學習與階層高斯過濾推深度網路效能
人工智慧訓練界面臨速度與深度退化問題。研究把預測編碼重構為階層高斯過濾,恢復精準度加權訊息傳遞,使每層估算不確定性並同時學習權重與精準度;在FashionMNIST上,耗時與收斂逼近反向傳播,且在線學習、數據效率與概念漂移任務表現更佳,且推論不需迭代或全域誤差訊號。
核心新聞
研究指出,預測編碼的速度與深度退化問題源自一項簡化:把精準度矩陣固定為單位矩陣,因而捨棄了變分導出所需的精準度加權誤差訊息。團隊以階層高斯過濾(HGF)重寫預測編碼,恢復精準度加權的訊息傳遞。
方法要點
新架構在每一層估算動態不確定性,並導出與Hebbian相容的本地更新規則。整個系統以單一自由能目標運作,能同時學習激活、權重與精準度,且推論過程不需迭代鬆弛、也不依賴自動微分或全域誤差訊號。
實驗與影響
在FashionMNIST上的評估顯示,此方法在實際耗時上接近反向傳播且通常以更少的訓練世代收斂。此外,在在線學習、資料效率與概念漂移任務上表現優勢,說明閉式變分推論結合線上精準度學習,能為深度預測編碼提供一個可行且可解釋的實作基礎。
延伸閱讀
- 自適應承諾深度:在 VLM 中學習何時重規劃以優化長程視覺推理
- CRAFT:結合原子陳述、ASR 與批判迴圈的多影片來源可追溯問答管線
- ATR 自適應表格檢索:查詢閾值與滑動視窗重排提升 text-to-SQL 精準度與效能
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。