混合精度訓練框架大幅提升 Neural ODE 效能

隨著模型與資料規模不斷擴大,深度學習的計算成本持續上升。傳統的混合精度訓練透過在高精度儲存權重、低精度執行運算來降低成本,但在連續時間模型如神經常微分方程(Neural ODE)上仍不穩定。

混合精度神經ODE加速

背景與挑戰

深度學習模型與資料集持續擴張,使得計算成本急速上升。混合精度訓練已成為降低成本的主流做法,通常將權重保留在高精度,僅對部分運算使用低精度。然而,這套策略在連續時間架構,如神經常微分方程(Neural ODE),上仍面臨數值不穩定與記憶體需求激增的問題。

新框架的核心做法

研究團隊提出一套混合精度訓練框架,主要包括:

  • 使用低精度計算神經網路參數化的速度函數。
  • 將 ODE 求解過程中的中間狀態以低精度儲存。
  • 透過自訂的動態伴隨縮放機制,確保反向傳播的數值可靠性。
  • 在累加解的結果與梯度時升級至更高精度,以避免累積誤差。

效能驗證

作者以影像分類與生成模型等多項挑戰性任務測試此框架,結果顯示:

  • 記憶體使用量降低約 50%。
  • 訓練速度提升最高達 2 倍。
  • 最終精度與傳統單精度訓練相當。

為方便社群使用,研究者同時釋出可擴充的開源 PyTorch 套件 rampde,語法與現有主流套件相似,可直接在既有程式碼中取代。

延伸閱讀

原始來源:ArXiv AI


系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。

Read more