深度分析 KV‑Cache 量化導致的 Jensen 偏差:以每分數校正恢復影片擴散品質 影片擴散模型以 KV‑cache 重用過往片段減少計算,但低位量化會導致 softmax 的指數引入系統性偏差(Jensen 偏差),使量化後的鍵值不當吸走注意力。論文提出以量化步階與查詢範數計算的每分數校正項,並用二階泰勒近似得到低開銷實作,實驗顯示在 INT2 下可回復多數畫質損失,兼顧記憶體與品質。