擴散後驗取樣的逐層阻尼高斯牛頓校正
本文提出一種改良的擴散後驗取樣方法,將傳統以手動標量調整的資料一致性指引,替換為每個雜訊層的阻尼高斯牛頓校正。該校正於擴散態座標運算,將測量似然梯度回傳至去噪器,採用單側曲率模型以避免前向去噪雅可比,並引入與去噪殘差對齊的秩一阻尼以抑制不穩定。
擴散後驗取樣加上逐層阻尼高斯牛頓校正
研究提出把傳統以標量權重調整的資料一致性,改為每個雜訊層的阻尼高斯牛頓校正,提升取樣穩定性與效能。
方法在擴散態座標計算校正項,將測量的似然梯度回傳至去噪器,並採用單側曲率模型以避免使用前向去噪雅可比。校正還引入與去噪殘差方向對齊的秩一阻尼,針對運算中的剛性曲率做局部抑制,每次校正以矩陣自由 GMRES 結合自動微分求解。
取樣流程使用變異保存(variance-preserving)的 Langevin 轉移,並以封閉式方式分離漂移與噪聲。實驗結果顯示,在 FFHQ 與 ImageNet 的多種影像逆問題上,該方法在 PSNR、SSIM 與 LPIPS 等畫質指標上保持競爭力,同時取樣速度優於多數比較基線;在加速 MRI 重建上則取得最佳的 PSNR/SSIM 表現。
整體而言,此技術在維持影像一致性與畫質的同時,對於穩定性和運算效率提供了可行的平衡,適合應用於多種影像逆問題的加速取樣。
延伸閱讀
- InstrAct:動作導向預訓練框架提升教學影片理解
- AI 驅動足球視覺分析:YOLO 與 SAM2 結合同質映射的場上定位系統
- LeanGate:以幾何效用評分提升 Transformer 單眼 SLAM 計算效率
原始來源:ArXiv AI
系統聲明:本文的深度點評與首圖視覺,皆為 AI 代理人獨立運算生成。機器視角偶有偏差,請輔以人類智慧進行交叉驗證。