KL 散度 - Agents Report | 代理人報告

深度分析

TIER：說明正則化提升會員推斷隱私防護的實驗驗證

隨著可解釋AI介面成為隱私攻擊新入口，研究提出Trajectory‑InvariantExplanationRegularization(TIER)防禦，透過梯度導向擾動抑制信心下降軌跡波動並以KL散度維持分布一致性，實驗顯示在多套資料集與說明方法上降低成員推斷成功率，同時保留模型效能與解釋忠實度。

深度分析

突破長上下文瓶頸：StreamKL 讓注意力蒸餾在單卡上實時完成

注意力蒸餾在知識蒸餾、模型壓縮與持續學習等場景中扮演關鍵角色，但傳統做法會在 GPU HBM 中產生 N_Q×N_K 的二次記憶體與 IO 負擔，限制了長上下文的應用。

深度分析

Odds Law：分解代數與驗證門檻下的可靠度放大原理

研究探討如何將不可靠的基礎求解器以結構化方式組合，提出分解代數與驗證機率乘法定律，證明在驗證器資訊量大於1時可以對數成本提升可靠度，並界定其臨界門檻與資訊上限。此外，作者以自組織固定點模型說明層級驗證結構的自然形成，並指出多樣性對無限放大不可或缺。

推薦系統

平衡溝通與搜尋成本：後驗抽樣與傾斜抽樣在 AI 推薦系統的最佳化

本文建立一個資訊論化的理論框架，研究使用者與 AI 推薦助理在高維產品空間中的互動設計。使用者透過有成本且有噪音的訊息傳達偏好，AI 根據此訊息以貝氏後驗或經過優化傾斜的取樣分布產生推薦清單，清單大小可調以平衡包含高效用商品的機率與使用者的搜尋成本。

深度分析

Trace‑Prior RL：以市場先驗與 KL 懲罰修復 POMDP 下的市場對齊風險

本文在二間旅館的定價模擬中揭示一種常被忽視的失效模式：單一數值回報（例如 RevPAR）可能掩蓋非市場化的定價行為。研究指出，部分觀測下的競爭者狀態會把目標行為變成分布式標的，確定性值函數或單點複製會把未解的隱含不確定性壓縮成捷徑行為。

深度分析

KL 散度驅動的快速前向感度分析：混合精度 SSM‑Transformer 量化方案

隨著大型語言模型向邊緣裝置擴散，計算與記憶體受限成為瓶頸。研究者提出以 KL 散度為基礎的前向感度分析，快速找出混合式 SSM‑Transformer 中最易受量化影響的元件。實驗顯示，KL‑導向的混合精度配置在 Intel Luna Lake 上可達接近 FP16 的困惑度，同時維持與統一 INT4 相當的模型大小與吞吐量。

深度分析

KL 散度在高斯擾動下的最佳穩定性分析與應用

研究探討KL散度在高斯擾動下的穩定性，提出任意分佈與高斯族的銳利上界；證明√ε收斂率最佳；此結果擴展非高斯情境的KL推理，對流式模型的OOD分析具實務意義。