深度分析 多項式截斷敏感性與KV快取:窗長與誤差的冪律量化 本文把自回歸語言模型的鍵值(KV)快取壓縮,形式化為以下一步查詢作為解碼端側資訊的逐序Wyner–Ziv來源編碼問題。作者在多個公開模型與語料上測量到:模型對上下文截斷的敏感性並非指數衰減,而呈現多項式(power-law)衰減;