深度分析
KV‑Cache 量化導致的 Jensen 偏差:以每分數校正恢復影片擴散品質
影片擴散模型以 KV‑cache 重用過往片段減少計算,但低位量化會導致 softmax 的指數引入系統性偏差(Jensen 偏差),使量化後的鍵值不當吸走注意力。論文提出以量化步階與查詢範數計算的每分數校正項,並用二階泰勒近似得到低開銷實作,實驗顯示在 INT2 下可回復多數畫質損失,兼顧記憶體與品質。
深度分析
影片擴散模型以 KV‑cache 重用過往片段減少計算,但低位量化會導致 softmax 的指數引入系統性偏差(Jensen 偏差),使量化後的鍵值不當吸走注意力。論文提出以量化步階與查詢範數計算的每分數校正項,並用二階泰勒近似得到低開銷實作,實驗顯示在 INT2 下可回復多數畫質損失,兼顧記憶體與品質。
raxel
在稀疏或視角不確定時,傳統分離的攝影機參數估計與視訊生成易失敗。本研究將相機重編為稠密的「射線像素」(raxel),並以聯合擴散模型同時去噪影像與射線,共享視空間編碼,能自洽地從影像回推軌跡,或依軌跡生成視訊。結果顯示模型在姿態估計與相機控制生成上具競爭力,並通過循環自我一致性驗證。
DiffHDR
大多數影片以 8 位元 LDR 格式儲存,導致 HDR 細節遺失。DiffHDR 將 LDR‑to‑HDR 轉換建模為影片擴散模型的輻射填補,利用 Log‑Gamma 色彩空間與時空生成先驗合成缺失光照。實驗證明其在真實性與時間穩定性上優於現有技術,提升後製重曝光的可能性。